Seedance 2.0: pattern di prompt e sei casi d'uso per il video AI
Guida per creatori a Seedance 2.0 — input multi-riferimento, output 2K nativo, timeline multi-shot e sei prompt testati con risultati su OmniArt.

Seedance 2.0 è il modello che scegli quando il brief suona da regia. ByteDance lo ha rilasciato a febbraio 2026 come Transformer di diffusione multimodale unificato che accetta testo, fino a nove immagini, tre video di riferimento e tre file audio in un solo prompt — tutti referenziabili con la sintassi @image1 e @video1. Il risultato è il percorso più pulito oggi per la coerenza del personaggio su timeline multi-shot. Questa guida copre la grammatica dei prompt che rispetta il modello e sei casi d'uso testati con prompt e risultati.
Cos'è Seedance 2.0
Seedance 2.0 genera clip da 4–15 secondi fino a 2K con audio stereo nativo. Il punto forte non è solo la risoluzione — è l'architettura multi-riferimento e il prompting multi-shot in stile timeline.
| Specifica | Valore |
|---|---|
| Architettura | Transformer di diffusione multimodale unificato |
| Risoluzione massima | 2K |
| Durata | 4–15 secondi |
| Input immagine | fino a 9 (@image1–@image9) |
| Input video | fino a 3 (@video1–@video3) |
| Input audio | fino a 3 (@audio1–@audio3) |
| Output audio nativo | Sì — dialogo, SFX, ambiente, musica |
| Lingue lip-sync | 7+ |
| Modalità | Standard, Fast |
Perché conta il sistema multi-riferimento
La maggior parte dei modelli video accetta un solo riferimento, o nessuno. Seedance 2.0 accetta uno stack e ti permette di assegnare ogni riferimento a un ruolo nel prompt. Usa @image1 per il volto del personaggio, @image2 per il costume, @image3 per la location, @video1 per il movimento di camera che vuoi, @audio1 per la base musicale. L'output rispetta ciascuno come istruzione distinta invece di mediare tutto in rumore.
È il motivo pratico per cui la somiglianza del personaggio regge tra gli shot: lo stesso riferimento @image entra in ogni shot della timeline e il modello lo usa come ancora d'identità invece di re-inferire il personaggio dal prompt ogni volta.
Struttura del prompt che funziona
Seedance 2.0 premia una struttura in sei parti.
- Soggetto — chi o cosa è in scena
- Azione / movimento — cosa fa
- Ambientazione — dove succede
- Stile visivo — riferimenti cinematografici, palette, epoca
- Direzione camera — termini cinematografici specifici
- Illuminazione — direzione, qualità, ora del giorno
Un buon template:
"Soggetto (con riferimento
@image1se serve). Azione. Ambientazione. Stile visivo. Direzione camera (termine cinematografico specifico). Dettaglio illuminazione."
Notazione timeline multi-shot
Per lavori multi-shot, scrivi la timeline direttamente nel prompt.
0–4s: wide establishing, il personaggio (in @image1) entra in scena
4–8s: medium tracking lo segue attraverso la stanza
8–12s: orbita a 360° intorno al tavolo che raggiunge
Fissa lo stesso @image1 in ogni segmento. La somiglianza resta coerente al taglio.
Disciplina dei tag di riferimento
Una regola breve che ripaga:
- Usa
@image1,@image2per foto volto e still di prodotto. - Usa
@video1per il movimento di camera da copiare. - Usa
@audio1quando la base audio conta più del default del modello. - Referenzia ogni tag esplicitamente nel testo. Non contare che il modello indovini quale riferimento fa quale ruolo.
Sei casi d'uso testati con prompt
Ogni prompt sotto l'abbiamo eseguito su Seedance 2.0. La colonna risultati è ciò che abbiamo ottenuto, con tempi misurati in Standard 720p.
1. Scena cinematografica
"Un detective in pensione con lungo cappotto scuro cammina in un vicolo bagnato di pioggia di notte. Insegne al neon riflettono rosso e blu sui ciottoli bagnati. Si ferma, accende una sigaretta e guarda alle spalle. Slow push-in da wide a medium close-up. Stile film noir, lens flare anamorfico, color grading teal-arancio, grana pellicola."
Risultato. Push-in fluido. Riflessi pioggia convincenti, movimento naturale del cappotto. Accensione sigaretta senza distorsione delle mani. Audio pioggia e città in sync. ~70 secondi.
2. Spot prodotto
"Una bottiglia di profumo di lusso ruota lentamente su marmo nero lucido. Il liquido dorato cattura la luce mentre gira. Particelle dorate fluttuano nell'aria. Macro close-up, orbita lenta a 360°. Illuminazione da studio con rim light calda, stile fotografia commerciale high-end."
Risultato. Rifrazione vetro e liquido accurati. Particelle naturali. Rotazione completa fluida, angoli luce corretti, texture marmo visibile. ~65 secondi.
3. Video musicale
"Una cantante in abito di seta rosso fluido su un rooftop al tramonto. Skyline dietro di lei. Vento muove capelli e vestito. Canta con intensità emotiva, braccia aperte. Tracking dinamico che la circonda. Golden hour backlight, lens flare, toni caldi vibranti."
Risultato. Fisica del vestito realistica. Orbita fluida. Volto coerente durante la rotazione. Capelli allineati al vento. Traccia musicale ambient generata. ~75 secondi.
4. Ritratto in movimento
"Un artigiano giapponese anziano in bottega di legno tradizionale, luce mattutina attraverso shoji. Solleva lentamente una ciotola da tè in ceramica forgata a mano, la esamina con orgoglio quieto. Mani segnate dal tempo ruotano la ciotola. Close-up delle mani, poi tilt lento fino al volto. Estetica wabi-sabi, luce naturale calda, qualità ritratto documentaristico."
Risultato. Conteggio dita corretto. Movimento articolazioni naturale. Tilt fluido mani-volto. Luce realistica attraverso gli shoji. Suoni bottega leggeri. Texture pelle realistica. ~80 secondi.
5. Natura e paesaggio
"Ripresa drone aerea che scivola su una valle montana nebbiosa all'alba. Strati di nebbia tra picchi verde smeraldo. Un fiume serpeggiante riflette la luce dorata del mattino. Aquile attraversano il frame a livello occhi. Tracking in avanti con leggera discesa. Paesaggio epico, nebbia volumetrica, golden hour."
Risultato. Strati nebbia indipendenti creano profondità convincente. Riflessi fiume aggiornati con la camera. Bilanciamento palette forte. Nebbia volumetrica pulita. Audio vento e richiami uccelli. ~55 secondi — il più veloce dei sei.
6. Anime e fantasy
"Una principessa guerriera anime in cima a una scogliera su una città medievale in fiamme di notte. Capelli argento lunghi e mantello cremisi al vento. Estrae una katana blu luminosa, elettricità lungo la lama. Petali di ciliegio turbinano. Low-angle dinamico con slow push-in. Cel-shading, accenti neon vibranti, speed line drammatiche."
Risultato. Cel-shading coerente. Estrazione katana fluida. Effetto elettricità integrato. Petali in movimento indipendente. Interazione luce fuoco con mantello. Audio swoosh spada drammatico. ~70 secondi.
Errori comuni e fix
| Problema | Causa | Fix |
|---|---|---|
| Prompt rifiutato | Parole chiave volto o formulazione ambigua | Rimuovi descrizioni volto esplicite; usa riferimenti @image |
| Frame neri | Prompt troppo complesso | Una azione ogni 4–5 s; abbassa risoluzione per il test |
| Volto che cambia tra shot | Nessun riferimento coerente | Fissa lo stesso @image1 in ogni shot della timeline |
| Audio fuori sync | Mismatch diffusione congiunta | Rigenera senza audio, aggiungi base a parte |
| Distorsione mani/dita | Interazione mani complessa senza riferimento | Aggiungi immagine riferimento della posa mani |
| Texture «da AI» | Troppi keyword di stile | Aggiungi dettagli fisici — materiali, luce, tipo obiettivo |
Seedance 2.0 vs Seedance 1.0
Se hai usato 1.0, il salto a 2.0 è più ampio del numero di versione.
| Funzione | 1.0 | 2.0 |
|---|---|---|
| Architettura | Pipeline separate | Transformer diffusione unificato |
| Input immagine | 1 opzionale | fino a 9, con @tag |
| Input video | Nessuno | fino a 3 |
| Input audio | Nessuno | fino a 3 |
| Output audio nativo | No | Sì |
| Risoluzione max | 1080p | 2K |
| Durata | 5–10s | 4–15s |
| Multi-shot | Base | Storyboard timeline con coerenza cross-shot |
| Qualità mani | Artefatti frequenti | Miglioramento evidente |
| Editing in-video | No | Sì — swap personaggio/oggetto |
| Utilizzabile al primo tentativo | ~60% | 90%+ |
Quando scegliere altro
Seedance 2.0 non è lo strumento giusto per ogni brief.
| Esigenza | Scelta migliore |
|---|---|
| 4K a 60fps per broadcast | Veo 3 |
| Direzione movimento frame-level | Runway Gen-4.5 |
| Social 720p con audio più economico | Grok Imagine |
| Loop iterazione più veloce | HappyHorse 1.0 |
| Controllo obiettivo parametrizzato | V6 |
| Scena lunga single-take | Sora 2 |
Prezzi su OmniArt
Seedance 2.0 è a crediti nel workspace video OmniArt. Standard 720p: 30 crediti al secondo; Fast 720p: 20 crediti al secondo. I membri Ultra hanno sconto crediti del 40% su entrambe le modalità. Come controllo rapido: clip 5 s Standard 720p = 150 crediti; 5 s Fast 720p = 100.
Warning
ByteDance non ha pubblicato diritti d'uso commerciale espliciti per gli output Seedance 2.0 alla data di questa guida. Per lavori commerciali ad alto rischio, verifica i termini di licenza della piattaforma prima della consegna.
Iniziare su OmniArt
Seedance 2.0 è nel workspace video OmniArt accanto a V6, BACH, Sora 2, Veo 3, Kling 3.0, HappyHorse 1.0 e Grok Imagine. Stesso saldo crediti, stesso upload riferimenti, stessa grammatica prompt.
Inizia con il prompt della scena cinematografica sopra per sentire il flusso multi-riferimento, poi passa al brief music video quando vuoi testare la coerenza del volto in movimento.
Se scegli tra Seedance 2.0 e HappyHorse 1.0, il confronto HappyHorse 1 vs Seedance 2 analizza i compromessi shot per shot. Per sequenze narrative più lunghe, la guida cinematografica BACH è il punto di partenza migliore.