guideModelli e insight8 min read
Journal · Modelli e insight

Seedance 2.0: pattern di prompt e sei casi d'uso per il video AI

Guida per creatori a Seedance 2.0 — input multi-riferimento, output 2K nativo, timeline multi-shot e sei prompt testati con risultati su OmniArt.

Team OmniArt·
Seedance 2.0: pattern di prompt e sei casi d'uso per il video AI

Seedance 2.0 è il modello che scegli quando il brief suona da regia. ByteDance lo ha rilasciato a febbraio 2026 come Transformer di diffusione multimodale unificato che accetta testo, fino a nove immagini, tre video di riferimento e tre file audio in un solo prompt — tutti referenziabili con la sintassi @image1 e @video1. Il risultato è il percorso più pulito oggi per la coerenza del personaggio su timeline multi-shot. Questa guida copre la grammatica dei prompt che rispetta il modello e sei casi d'uso testati con prompt e risultati.

Cos'è Seedance 2.0

Seedance 2.0 genera clip da 4–15 secondi fino a 2K con audio stereo nativo. Il punto forte non è solo la risoluzione — è l'architettura multi-riferimento e il prompting multi-shot in stile timeline.

SpecificaValore
ArchitetturaTransformer di diffusione multimodale unificato
Risoluzione massima2K
Durata4–15 secondi
Input immaginefino a 9 (@image1@image9)
Input videofino a 3 (@video1@video3)
Input audiofino a 3 (@audio1@audio3)
Output audio nativoSì — dialogo, SFX, ambiente, musica
Lingue lip-sync7+
ModalitàStandard, Fast

Perché conta il sistema multi-riferimento

La maggior parte dei modelli video accetta un solo riferimento, o nessuno. Seedance 2.0 accetta uno stack e ti permette di assegnare ogni riferimento a un ruolo nel prompt. Usa @image1 per il volto del personaggio, @image2 per il costume, @image3 per la location, @video1 per il movimento di camera che vuoi, @audio1 per la base musicale. L'output rispetta ciascuno come istruzione distinta invece di mediare tutto in rumore.

È il motivo pratico per cui la somiglianza del personaggio regge tra gli shot: lo stesso riferimento @image entra in ogni shot della timeline e il modello lo usa come ancora d'identità invece di re-inferire il personaggio dal prompt ogni volta.

Struttura del prompt che funziona

Seedance 2.0 premia una struttura in sei parti.

  1. Soggetto — chi o cosa è in scena
  2. Azione / movimento — cosa fa
  3. Ambientazione — dove succede
  4. Stile visivo — riferimenti cinematografici, palette, epoca
  5. Direzione camera — termini cinematografici specifici
  6. Illuminazione — direzione, qualità, ora del giorno

Un buon template:

"Soggetto (con riferimento @image1 se serve). Azione. Ambientazione. Stile visivo. Direzione camera (termine cinematografico specifico). Dettaglio illuminazione."

Notazione timeline multi-shot

Per lavori multi-shot, scrivi la timeline direttamente nel prompt.

0–4s: wide establishing, il personaggio (in @image1) entra in scena
4–8s: medium tracking lo segue attraverso la stanza
8–12s: orbita a 360° intorno al tavolo che raggiunge

Fissa lo stesso @image1 in ogni segmento. La somiglianza resta coerente al taglio.

Disciplina dei tag di riferimento

Una regola breve che ripaga:

  • Usa @image1, @image2 per foto volto e still di prodotto.
  • Usa @video1 per il movimento di camera da copiare.
  • Usa @audio1 quando la base audio conta più del default del modello.
  • Referenzia ogni tag esplicitamente nel testo. Non contare che il modello indovini quale riferimento fa quale ruolo.

Sei casi d'uso testati con prompt

Ogni prompt sotto l'abbiamo eseguito su Seedance 2.0. La colonna risultati è ciò che abbiamo ottenuto, con tempi misurati in Standard 720p.

1. Scena cinematografica

"Un detective in pensione con lungo cappotto scuro cammina in un vicolo bagnato di pioggia di notte. Insegne al neon riflettono rosso e blu sui ciottoli bagnati. Si ferma, accende una sigaretta e guarda alle spalle. Slow push-in da wide a medium close-up. Stile film noir, lens flare anamorfico, color grading teal-arancio, grana pellicola."

Risultato. Push-in fluido. Riflessi pioggia convincenti, movimento naturale del cappotto. Accensione sigaretta senza distorsione delle mani. Audio pioggia e città in sync. ~70 secondi.

2. Spot prodotto

"Una bottiglia di profumo di lusso ruota lentamente su marmo nero lucido. Il liquido dorato cattura la luce mentre gira. Particelle dorate fluttuano nell'aria. Macro close-up, orbita lenta a 360°. Illuminazione da studio con rim light calda, stile fotografia commerciale high-end."

Risultato. Rifrazione vetro e liquido accurati. Particelle naturali. Rotazione completa fluida, angoli luce corretti, texture marmo visibile. ~65 secondi.

3. Video musicale

"Una cantante in abito di seta rosso fluido su un rooftop al tramonto. Skyline dietro di lei. Vento muove capelli e vestito. Canta con intensità emotiva, braccia aperte. Tracking dinamico che la circonda. Golden hour backlight, lens flare, toni caldi vibranti."

Risultato. Fisica del vestito realistica. Orbita fluida. Volto coerente durante la rotazione. Capelli allineati al vento. Traccia musicale ambient generata. ~75 secondi.

4. Ritratto in movimento

"Un artigiano giapponese anziano in bottega di legno tradizionale, luce mattutina attraverso shoji. Solleva lentamente una ciotola da tè in ceramica forgata a mano, la esamina con orgoglio quieto. Mani segnate dal tempo ruotano la ciotola. Close-up delle mani, poi tilt lento fino al volto. Estetica wabi-sabi, luce naturale calda, qualità ritratto documentaristico."

Risultato. Conteggio dita corretto. Movimento articolazioni naturale. Tilt fluido mani-volto. Luce realistica attraverso gli shoji. Suoni bottega leggeri. Texture pelle realistica. ~80 secondi.

5. Natura e paesaggio

"Ripresa drone aerea che scivola su una valle montana nebbiosa all'alba. Strati di nebbia tra picchi verde smeraldo. Un fiume serpeggiante riflette la luce dorata del mattino. Aquile attraversano il frame a livello occhi. Tracking in avanti con leggera discesa. Paesaggio epico, nebbia volumetrica, golden hour."

Risultato. Strati nebbia indipendenti creano profondità convincente. Riflessi fiume aggiornati con la camera. Bilanciamento palette forte. Nebbia volumetrica pulita. Audio vento e richiami uccelli. ~55 secondi — il più veloce dei sei.

6. Anime e fantasy

"Una principessa guerriera anime in cima a una scogliera su una città medievale in fiamme di notte. Capelli argento lunghi e mantello cremisi al vento. Estrae una katana blu luminosa, elettricità lungo la lama. Petali di ciliegio turbinano. Low-angle dinamico con slow push-in. Cel-shading, accenti neon vibranti, speed line drammatiche."

Risultato. Cel-shading coerente. Estrazione katana fluida. Effetto elettricità integrato. Petali in movimento indipendente. Interazione luce fuoco con mantello. Audio swoosh spada drammatico. ~70 secondi.

Errori comuni e fix

ProblemaCausaFix
Prompt rifiutatoParole chiave volto o formulazione ambiguaRimuovi descrizioni volto esplicite; usa riferimenti @image
Frame neriPrompt troppo complessoUna azione ogni 4–5 s; abbassa risoluzione per il test
Volto che cambia tra shotNessun riferimento coerenteFissa lo stesso @image1 in ogni shot della timeline
Audio fuori syncMismatch diffusione congiuntaRigenera senza audio, aggiungi base a parte
Distorsione mani/ditaInterazione mani complessa senza riferimentoAggiungi immagine riferimento della posa mani
Texture «da AI»Troppi keyword di stileAggiungi dettagli fisici — materiali, luce, tipo obiettivo

Seedance 2.0 vs Seedance 1.0

Se hai usato 1.0, il salto a 2.0 è più ampio del numero di versione.

Funzione1.02.0
ArchitetturaPipeline separateTransformer diffusione unificato
Input immagine1 opzionalefino a 9, con @tag
Input videoNessunofino a 3
Input audioNessunofino a 3
Output audio nativoNo
Risoluzione max1080p2K
Durata5–10s4–15s
Multi-shotBaseStoryboard timeline con coerenza cross-shot
Qualità maniArtefatti frequentiMiglioramento evidente
Editing in-videoNoSì — swap personaggio/oggetto
Utilizzabile al primo tentativo~60%90%+

Quando scegliere altro

Seedance 2.0 non è lo strumento giusto per ogni brief.

EsigenzaScelta migliore
4K a 60fps per broadcastVeo 3
Direzione movimento frame-levelRunway Gen-4.5
Social 720p con audio più economicoGrok Imagine
Loop iterazione più veloceHappyHorse 1.0
Controllo obiettivo parametrizzatoV6
Scena lunga single-takeSora 2

Prezzi su OmniArt

Seedance 2.0 è a crediti nel workspace video OmniArt. Standard 720p: 30 crediti al secondo; Fast 720p: 20 crediti al secondo. I membri Ultra hanno sconto crediti del 40% su entrambe le modalità. Come controllo rapido: clip 5 s Standard 720p = 150 crediti; 5 s Fast 720p = 100.

Warning

ByteDance non ha pubblicato diritti d'uso commerciale espliciti per gli output Seedance 2.0 alla data di questa guida. Per lavori commerciali ad alto rischio, verifica i termini di licenza della piattaforma prima della consegna.

Iniziare su OmniArt

Seedance 2.0 è nel workspace video OmniArt accanto a V6, BACH, Sora 2, Veo 3, Kling 3.0, HappyHorse 1.0 e Grok Imagine. Stesso saldo crediti, stesso upload riferimenti, stessa grammatica prompt.

Inizia con il prompt della scena cinematografica sopra per sentire il flusso multi-riferimento, poi passa al brief music video quando vuoi testare la coerenza del volto in movimento.

Se scegli tra Seedance 2.0 e HappyHorse 1.0, il confronto HappyHorse 1 vs Seedance 2 analizza i compromessi shot per shot. Per sequenze narrative più lunghe, la guida cinematografica BACH è il punto di partenza migliore.

Start creating

Pronto a creare?

Inizia a generare contenuti straordinari con l’AI