guideModelos e insights7 min read
Journal · Modelos e insights

Seedance 2.0: padrões de prompt e 6 casos de uso em vídeo IA

Guia Seedance 2.0 para criadores — entradas multi-referência, 2K nativo, timelines multi-shot e 6 prompts testados na OmniArt com resultados.

Equipe OmniArt·
Seedance 2.0: padrões de prompt e 6 casos de uso em vídeo IA

O Seedance 2.0 é o modelo que criadores pegam quando o brief lê como nota de direção. A ByteDance lançou em fevereiro de 2026 como Transformer de difusão multimodal unificado — um prompt aceita texto, até 9 imagens, 3 clipes de referência e 3 áudios, todos endereçáveis com @image1 / @video1. É o caminho mais limpo para consistência de personagem em timelines multi-shot. Este guia cobre a gramática de prompt que respeita o modelo e seis casos de uso testados com prompts e resultados.

O que é o Seedance 2.0

Gera clipes de 4–15 segundos em até 2K com áudio estéreo nativo. O diferencial não é só resolução — é a arquitetura multi-referência e prompts multi-shot em formato de timeline.

EspecificaçãoValor
ArquiteturaTransformer de difusão multimodal unificado
Resolução máxima2K
Duração4–15 s
Entrada de imagemAté 9 (@image1@image9)
Entrada de vídeoAté 3 (@video1@video3)
Entrada de áudioAté 3 (@audio1@audio3)
Saída de áudio nativaSim — diálogo, SFX, ambiente, música
Idiomas de lip-sync7+
ModosStandard, Fast

Por que o sistema multi-referência importa

Muitos modelos de vídeo aceitam uma referência ou nenhuma. O Seedance 2.0 aceita a pilha e permite amarrar cada referência a um papel no prompt: @image1 para rosto, @image2 para roupa, @image3 para locação, @video1 para o movimento de câmera desejado, @audio1 para a base musical. A saída trata cada uma como instrução discreta, não média tudo em ruído.

A razão prática da consistência de likeness entre shots: a mesma referência @image entra em cada segmento da timeline e ancora identidade em vez de re-inferir do zero a cada corte.

Estrutura de prompt que funciona

Recompense prompts em seis partes:

  1. Sujeito — quem ou o quê na tela
  2. Ação/movimento — o que faz
  3. Cenário/ambiente — onde
  4. Estilo visual — referências de filme, paleta, época
  5. Instruções de câmera — termos cinematográficos concretos
  6. Iluminação — direção, qualidade, hora

Template útil:

«Sujeito (com referência @image1 se aplicável). Ação. Cenário. Estilo visual. Instruções de câmera (termos cinematográficos concretos). Detalhes de iluminação.»

Notação de timeline multi-shot

Em multi-shot, descreva a timeline diretamente no prompt:

0–4s: plano geral de estabelecimento, personagem (@image1) entra na cena
4–8s: travelling médio atravessando o ambiente
8–12s: órbita 360° ao redor da mesa ao chegar

Fixe o mesmo @image1 em cada segmento para manter likeness entre cortes.

Disciplina de tags de referência

  • @image1, @image2: retratos ou stills de produto.
  • @video1: movimento de câmera a copiar.
  • @audio1: quando a base importa mais que o default do modelo.
  • Referencie cada tag no texto; não deixe o modelo adivinhar papéis.

Seis casos de uso testados com prompts

Prompts executados em Standard 720p.

1. Cena cinematográfica

«Detetive aposentado de casaco preto longo caminha por beco chuvoso à noite. Neon reflete vermelho e azul no paralelepípedo molhado. Para, acende cigarro, olha para trás. Push-in lento de plano geral para close médio. Film noir, flare anamórfico, grading teal-laranja, grain de filme.»

Resultado. Push-in suave; reflexos de chuva convincentes; movimento natural do casaco; sem distorção nas mãos ao acender. Ambiente de chuva e rua sincronizado. ~70 s.

2. Comercial de produto

«Frasco de perfume de luxo gira devagar sobre mármore preto. Líquido dourado captura luz na rotação. Partículas douradas flutuam ao redor. Macro close, órbita lenta 360°. Luz de estúdio, rim quente, fotografia comercial high-end.»

Resultado. Refração de vidro e líquido corretas; drift natural de partículas; rotação completa suave. ~65 s.

3. Videoclipe

«Cantora de vestido de seda vermelha performa em terraço ao pôr do sol com skyline atrás. Vento move cabelo e vestido de forma dramática. Canta com emoção, braços abertos. Tracking dinâmico ao redor dela. Hora dourada contraluz, lens flare, paleta quente vibrante.»

Resultado. Física realista do vestido; órbita fluida; rosto consistente na rotação; cabelo alinhado ao vento; trilha ambiente gerada. ~75 s.

4. Retrato com movimento

«Artesão japonês idoso em oficina de madeira tradicional, luz matinal através de shoji. Ergue tigela de chá feita à mão com orgulho, gira devagar nas mãos enrugadas. Tilt lento de close nas mãos para o rosto. Wabi-sabi, luz natural quente, retrato documental.»

Resultado. Contagem correta de dedos; articulação natural; tilt suave mãos→rosto; luz shoji realista; micro-som ambiente da oficina. ~80 s.

5. Natureza e paisagem

«Drone sobre vale montanhoso com névoa ao nascer do sol. Camadas de névoa entre picos esmeralda. Rio sinuoso reflete luz dourada abaixo. Águia voa na altura do olhar; câmera avança suavemente com leve descida. Paisagem épica, névoa volumétrica, hora dourada.»

Resultado. Camadas de névoa independentes; reflexo do rio atualiza com a câmera; paleta forte; névoa limpa; vento e pássaros. ~55 s — o mais rápido dos seis.

6. Anime e fantasia

«Princesa guerreira anime no penhasco sobre cidade medieval em chamas à noite. Cabelo prateado e manto carmesim ao vento. Desembainha katana azul brilhante com eletricidade na lâmina. Pétalas de cerejeira em espiral. Push-in lento de ângulo baixo. Cel-shading, acentos neon, speed lines.»

Resultado. Cel-shading consistente; desembainhar fluido; eletricidade integrada; sakura independente; som de katana dramático. ~70 s.

Erros comuns e correções

ProblemaCausaCorreção
Prompt recusadoPalavras de rosto vagasRemova descritores explícitos de rosto; use @image
Frame pretoPrompt excessivoUma ação por 4–5 s; teste resolução menor
Rosto muda entre shotsSem referênciaMesmo @image1 em cada shot da timeline
Áudio dessincronizadoMismatch na difusão conjuntaRegenere sem áudio; adicione bed depois
Mãos/dedos distorcidosMãos complexas sem refImagem de referência da pose desejada
Textura «gerada por IA»Excesso de keywords de estiloDetalhe físico — material, luz, lente

Seedance 2.0 vs 1.0

Recurso1.02.0
ArquiteturaPipeline separadoTransformer unificado
Imagens1 opcionalAté 9 com @tag
Vídeo/áudio inNãoAté 3 cada
Áudio nativoNãoSim
Resolução máx.1080p2K
Duração5–10 s4–15 s
Multi-shotBásicoTimeline consistente
MãosArtefatos frequentesMelhora clara
Primeiro usable~60%90%+

Quando escolher outro modelo

Precisa deMelhor opção
4K 60fps broadcastVeo 3
Motion frame a frameRunway Gen-4.5
SNS barato 720p+áudioGrok Imagine
Iteração mais rápidaHappyHorse 1.0
Lentes com parâmetrosV6
Plano único longoSora 2

Créditos na OmniArt

Standard 720p: 30 créditos/s; Fast 720p: 20/s. Ultra: 40% off em ambos. 5 s Standard 720p = 150 créditos; Fast = 100.

Warning

Na redação, a ByteDance ainda não publicou direitos comerciais explícitos para saídas Seedance 2.0. Confirme licença da plataforma antes de uso comercial de alto risco.

Começar na OmniArt

Seedance 2.0 está ao lado de V6, BACH, Sora 2, Veo 3, Kling 3.0, HappyHorse 1.0 e Grok Imagine — mesmo saldo, mesmas referências, mesma gramática.

Teste multi-referência com o prompt de cena cinematográfica; depois brief de clipe com teste de consistência facial.

Para escolha vs HappyHorse 1.0, veja HappyHorse 1 vs Seedance 2. Para narrativa longa, guia BACH.

Start creating

Pronto para criar?

Comece a gerar conteúdo incrível com IA