Seedance 2.0: padrões de prompt e 6 casos de uso em vídeo IA
Guia Seedance 2.0 para criadores — entradas multi-referência, 2K nativo, timelines multi-shot e 6 prompts testados na OmniArt com resultados.

O Seedance 2.0 é o modelo que criadores pegam quando o brief lê como nota de direção. A ByteDance lançou em fevereiro de 2026 como Transformer de difusão multimodal unificado — um prompt aceita texto, até 9 imagens, 3 clipes de referência e 3 áudios, todos endereçáveis com @image1 / @video1. É o caminho mais limpo para consistência de personagem em timelines multi-shot. Este guia cobre a gramática de prompt que respeita o modelo e seis casos de uso testados com prompts e resultados.
O que é o Seedance 2.0
Gera clipes de 4–15 segundos em até 2K com áudio estéreo nativo. O diferencial não é só resolução — é a arquitetura multi-referência e prompts multi-shot em formato de timeline.
| Especificação | Valor |
|---|---|
| Arquitetura | Transformer de difusão multimodal unificado |
| Resolução máxima | 2K |
| Duração | 4–15 s |
| Entrada de imagem | Até 9 (@image1–@image9) |
| Entrada de vídeo | Até 3 (@video1–@video3) |
| Entrada de áudio | Até 3 (@audio1–@audio3) |
| Saída de áudio nativa | Sim — diálogo, SFX, ambiente, música |
| Idiomas de lip-sync | 7+ |
| Modos | Standard, Fast |
Por que o sistema multi-referência importa
Muitos modelos de vídeo aceitam uma referência ou nenhuma. O Seedance 2.0 aceita a pilha e permite amarrar cada referência a um papel no prompt: @image1 para rosto, @image2 para roupa, @image3 para locação, @video1 para o movimento de câmera desejado, @audio1 para a base musical. A saída trata cada uma como instrução discreta, não média tudo em ruído.
A razão prática da consistência de likeness entre shots: a mesma referência @image entra em cada segmento da timeline e ancora identidade em vez de re-inferir do zero a cada corte.
Estrutura de prompt que funciona
Recompense prompts em seis partes:
- Sujeito — quem ou o quê na tela
- Ação/movimento — o que faz
- Cenário/ambiente — onde
- Estilo visual — referências de filme, paleta, época
- Instruções de câmera — termos cinematográficos concretos
- Iluminação — direção, qualidade, hora
Template útil:
«Sujeito (com referência
@image1se aplicável). Ação. Cenário. Estilo visual. Instruções de câmera (termos cinematográficos concretos). Detalhes de iluminação.»
Notação de timeline multi-shot
Em multi-shot, descreva a timeline diretamente no prompt:
0–4s: plano geral de estabelecimento, personagem (@image1) entra na cena
4–8s: travelling médio atravessando o ambiente
8–12s: órbita 360° ao redor da mesa ao chegar
Fixe o mesmo @image1 em cada segmento para manter likeness entre cortes.
Disciplina de tags de referência
@image1,@image2: retratos ou stills de produto.@video1: movimento de câmera a copiar.@audio1: quando a base importa mais que o default do modelo.- Referencie cada tag no texto; não deixe o modelo adivinhar papéis.
Seis casos de uso testados com prompts
Prompts executados em Standard 720p.
1. Cena cinematográfica
«Detetive aposentado de casaco preto longo caminha por beco chuvoso à noite. Neon reflete vermelho e azul no paralelepípedo molhado. Para, acende cigarro, olha para trás. Push-in lento de plano geral para close médio. Film noir, flare anamórfico, grading teal-laranja, grain de filme.»
Resultado. Push-in suave; reflexos de chuva convincentes; movimento natural do casaco; sem distorção nas mãos ao acender. Ambiente de chuva e rua sincronizado. ~70 s.
2. Comercial de produto
«Frasco de perfume de luxo gira devagar sobre mármore preto. Líquido dourado captura luz na rotação. Partículas douradas flutuam ao redor. Macro close, órbita lenta 360°. Luz de estúdio, rim quente, fotografia comercial high-end.»
Resultado. Refração de vidro e líquido corretas; drift natural de partículas; rotação completa suave. ~65 s.
3. Videoclipe
«Cantora de vestido de seda vermelha performa em terraço ao pôr do sol com skyline atrás. Vento move cabelo e vestido de forma dramática. Canta com emoção, braços abertos. Tracking dinâmico ao redor dela. Hora dourada contraluz, lens flare, paleta quente vibrante.»
Resultado. Física realista do vestido; órbita fluida; rosto consistente na rotação; cabelo alinhado ao vento; trilha ambiente gerada. ~75 s.
4. Retrato com movimento
«Artesão japonês idoso em oficina de madeira tradicional, luz matinal através de shoji. Ergue tigela de chá feita à mão com orgulho, gira devagar nas mãos enrugadas. Tilt lento de close nas mãos para o rosto. Wabi-sabi, luz natural quente, retrato documental.»
Resultado. Contagem correta de dedos; articulação natural; tilt suave mãos→rosto; luz shoji realista; micro-som ambiente da oficina. ~80 s.
5. Natureza e paisagem
«Drone sobre vale montanhoso com névoa ao nascer do sol. Camadas de névoa entre picos esmeralda. Rio sinuoso reflete luz dourada abaixo. Águia voa na altura do olhar; câmera avança suavemente com leve descida. Paisagem épica, névoa volumétrica, hora dourada.»
Resultado. Camadas de névoa independentes; reflexo do rio atualiza com a câmera; paleta forte; névoa limpa; vento e pássaros. ~55 s — o mais rápido dos seis.
6. Anime e fantasia
«Princesa guerreira anime no penhasco sobre cidade medieval em chamas à noite. Cabelo prateado e manto carmesim ao vento. Desembainha katana azul brilhante com eletricidade na lâmina. Pétalas de cerejeira em espiral. Push-in lento de ângulo baixo. Cel-shading, acentos neon, speed lines.»
Resultado. Cel-shading consistente; desembainhar fluido; eletricidade integrada; sakura independente; som de katana dramático. ~70 s.
Erros comuns e correções
| Problema | Causa | Correção |
|---|---|---|
| Prompt recusado | Palavras de rosto vagas | Remova descritores explícitos de rosto; use @image |
| Frame preto | Prompt excessivo | Uma ação por 4–5 s; teste resolução menor |
| Rosto muda entre shots | Sem referência | Mesmo @image1 em cada shot da timeline |
| Áudio dessincronizado | Mismatch na difusão conjunta | Regenere sem áudio; adicione bed depois |
| Mãos/dedos distorcidos | Mãos complexas sem ref | Imagem de referência da pose desejada |
| Textura «gerada por IA» | Excesso de keywords de estilo | Detalhe físico — material, luz, lente |
Seedance 2.0 vs 1.0
| Recurso | 1.0 | 2.0 |
|---|---|---|
| Arquitetura | Pipeline separado | Transformer unificado |
| Imagens | 1 opcional | Até 9 com @tag |
| Vídeo/áudio in | Não | Até 3 cada |
| Áudio nativo | Não | Sim |
| Resolução máx. | 1080p | 2K |
| Duração | 5–10 s | 4–15 s |
| Multi-shot | Básico | Timeline consistente |
| Mãos | Artefatos frequentes | Melhora clara |
| Primeiro usable | ~60% | 90%+ |
Quando escolher outro modelo
| Precisa de | Melhor opção |
|---|---|
| 4K 60fps broadcast | Veo 3 |
| Motion frame a frame | Runway Gen-4.5 |
| SNS barato 720p+áudio | Grok Imagine |
| Iteração mais rápida | HappyHorse 1.0 |
| Lentes com parâmetros | V6 |
| Plano único longo | Sora 2 |
Créditos na OmniArt
Standard 720p: 30 créditos/s; Fast 720p: 20/s. Ultra: 40% off em ambos. 5 s Standard 720p = 150 créditos; Fast = 100.
Warning
Na redação, a ByteDance ainda não publicou direitos comerciais explícitos para saídas Seedance 2.0. Confirme licença da plataforma antes de uso comercial de alto risco.
Começar na OmniArt
Seedance 2.0 está ao lado de V6, BACH, Sora 2, Veo 3, Kling 3.0, HappyHorse 1.0 e Grok Imagine — mesmo saldo, mesmas referências, mesma gramática.
Teste multi-referência com o prompt de cena cinematográfica; depois brief de clipe com teste de consistência facial.
Para escolha vs HappyHorse 1.0, veja HappyHorse 1 vs Seedance 2. Para narrativa longa, guia BACH.