guideModelos e insights7 min de leitura

Seedance 2.0: padrões de prompt e 6 casos de uso em vídeo IA

Guia Seedance 2.0 para criadores — entradas multi-referência, 2K nativo, timelines multi-shot e 6 prompts testados na OmniArt com resultados.

Equipe OmniArt2 de mai. de 2026

O Seedance 2.0 é o modelo que criadores pegam quando o brief lê como nota de direção. A ByteDance lançou em fevereiro de 2026 como Transformer de difusão multimodal unificado — um prompt aceita texto, até 9 imagens, 3 clipes de referência e 3 áudios, todos endereçáveis com @image1 / @video1. É o caminho mais limpo para consistência de personagem em timelines multi-shot. Este guia cobre a gramática de prompt que respeita o modelo e seis casos de uso testados com prompts e resultados.

O que é o Seedance 2.0

Gera clipes de 4–15 segundos em até 2K com áudio estéreo nativo. O diferencial não é só resolução — é a arquitetura multi-referência e prompts multi-shot em formato de timeline.

Especificação	Valor
Arquitetura	Transformer de difusão multimodal unificado
Resolução máxima	2K
Duração	4–15 s
Entrada de imagem	Até 9 (`@image1`–`@image9`)
Entrada de vídeo	Até 3 (`@video1`–`@video3`)
Entrada de áudio	Até 3 (`@audio1`–`@audio3`)
Saída de áudio nativa	Sim — diálogo, SFX, ambiente, música
Idiomas de lip-sync	7+
Modos	Standard, Fast

Por que o sistema multi-referência importa

Muitos modelos de vídeo aceitam uma referência ou nenhuma. O Seedance 2.0 aceita a pilha e permite amarrar cada referência a um papel no prompt: @image1 para rosto, @image2 para roupa, @image3 para locação, @video1 para o movimento de câmera desejado, @audio1 para a base musical. A saída trata cada uma como instrução discreta, não média tudo em ruído.

A razão prática da consistência de likeness entre shots: a mesma referência @image entra em cada segmento da timeline e ancora identidade em vez de re-inferir do zero a cada corte.

Estrutura de prompt que funciona

Recompense prompts em seis partes:

Sujeito — quem ou o quê na tela
Ação/movimento — o que faz
Cenário/ambiente — onde
Estilo visual — referências de filme, paleta, época
Instruções de câmera — termos cinematográficos concretos
Iluminação — direção, qualidade, hora

Template útil:

«Sujeito (com referência @image1 se aplicável). Ação. Cenário. Estilo visual. Instruções de câmera (termos cinematográficos concretos). Detalhes de iluminação.»

Notação de timeline multi-shot

Em multi-shot, descreva a timeline diretamente no prompt:

0–4s: plano geral de estabelecimento, personagem (@image1) entra na cena
4–8s: travelling médio atravessando o ambiente
8–12s: órbita 360° ao redor da mesa ao chegar

Fixe o mesmo @image1 em cada segmento para manter likeness entre cortes.

Disciplina de tags de referência

@image1, @image2: retratos ou stills de produto.
@video1: movimento de câmera a copiar.
@audio1: quando a base importa mais que o default do modelo.
Referencie cada tag no texto; não deixe o modelo adivinhar papéis.

Seis casos de uso testados com prompts

Prompts executados em Standard 720p.

1. Cena cinematográfica

«Detetive aposentado de casaco preto longo caminha por beco chuvoso à noite. Neon reflete vermelho e azul no paralelepípedo molhado. Para, acende cigarro, olha para trás. Push-in lento de plano geral para close médio. Film noir, flare anamórfico, grading teal-laranja, grain de filme.»

Resultado. Push-in suave; reflexos de chuva convincentes; movimento natural do casaco; sem distorção nas mãos ao acender. Ambiente de chuva e rua sincronizado. ~70 s.

2. Comercial de produto

«Frasco de perfume de luxo gira devagar sobre mármore preto. Líquido dourado captura luz na rotação. Partículas douradas flutuam ao redor. Macro close, órbita lenta 360°. Luz de estúdio, rim quente, fotografia comercial high-end.»

Resultado. Refração de vidro e líquido corretas; drift natural de partículas; rotação completa suave. ~65 s.

3. Videoclipe

«Cantora de vestido de seda vermelha performa em terraço ao pôr do sol com skyline atrás. Vento move cabelo e vestido de forma dramática. Canta com emoção, braços abertos. Tracking dinâmico ao redor dela. Hora dourada contraluz, lens flare, paleta quente vibrante.»

Resultado. Física realista do vestido; órbita fluida; rosto consistente na rotação; cabelo alinhado ao vento; trilha ambiente gerada. ~75 s.

4. Retrato com movimento

«Artesão japonês idoso em oficina de madeira tradicional, luz matinal através de shoji. Ergue tigela de chá feita à mão com orgulho, gira devagar nas mãos enrugadas. Tilt lento de close nas mãos para o rosto. Wabi-sabi, luz natural quente, retrato documental.»

Resultado. Contagem correta de dedos; articulação natural; tilt suave mãos→rosto; luz shoji realista; micro-som ambiente da oficina. ~80 s.

5. Natureza e paisagem

«Drone sobre vale montanhoso com névoa ao nascer do sol. Camadas de névoa entre picos esmeralda. Rio sinuoso reflete luz dourada abaixo. Águia voa na altura do olhar; câmera avança suavemente com leve descida. Paisagem épica, névoa volumétrica, hora dourada.»

Resultado. Camadas de névoa independentes; reflexo do rio atualiza com a câmera; paleta forte; névoa limpa; vento e pássaros. ~55 s — o mais rápido dos seis.

6. Anime e fantasia

«Princesa guerreira anime no penhasco sobre cidade medieval em chamas à noite. Cabelo prateado e manto carmesim ao vento. Desembainha katana azul brilhante com eletricidade na lâmina. Pétalas de cerejeira em espiral. Push-in lento de ângulo baixo. Cel-shading, acentos neon, speed lines.»

Resultado. Cel-shading consistente; desembainhar fluido; eletricidade integrada; sakura independente; som de katana dramático. ~70 s.

Erros comuns e correções

Problema	Causa	Correção
Prompt recusado	Palavras de rosto vagas	Remova descritores explícitos de rosto; use `@image`
Frame preto	Prompt excessivo	Uma ação por 4–5 s; teste resolução menor
Rosto muda entre shots	Sem referência	Mesmo `@image1` em cada shot da timeline
Áudio dessincronizado	Mismatch na difusão conjunta	Regenere sem áudio; adicione bed depois
Mãos/dedos distorcidos	Mãos complexas sem ref	Imagem de referência da pose desejada
Textura «gerada por IA»	Excesso de keywords de estilo	Detalhe físico — material, luz, lente

Seedance 2.0 vs 1.0

Recurso	1.0	2.0
Arquitetura	Pipeline separado	Transformer unificado
Imagens	1 opcional	Até 9 com `@tag`
Vídeo/áudio in	Não	Até 3 cada
Áudio nativo	Não	Sim
Resolução máx.	1080p	2K
Duração	5–10 s	4–15 s
Multi-shot	Básico	Timeline consistente
Mãos	Artefatos frequentes	Melhora clara
Primeiro usable	~60%	90%+

Quando escolher outro modelo

Precisa de	Melhor opção
4K 60fps broadcast	Veo 3
Motion frame a frame	Runway Gen-4.5
SNS barato 720p+áudio	Grok Imagine
Iteração mais rápida	HappyHorse 1.0
Lentes com parâmetros	V6
Plano único longo	Sora 2

Créditos na OmniArt

Standard 720p: 30 créditos/s; Fast 720p: 20/s. Ultra: 40% off em ambos. 5 s Standard 720p = 150 créditos; Fast = 100.

Aviso

Na redação, a ByteDance ainda não publicou direitos comerciais explícitos para saídas Seedance 2.0. Confirme licença da plataforma antes de uso comercial de alto risco.

Começar na OmniArt

Seedance 2.0 está ao lado de V6, BACH, Sora 2, Veo 3, Kling 3.0, HappyHorse 1.0 e Grok Imagine — mesmo saldo, mesmas referências, mesma gramática.

Teste multi-referência com o prompt de cena cinematográfica; depois brief de clipe com teste de consistência facial.

Para escolha vs HappyHorse 1.0, veja HappyHorse 1 vs Seedance 2. Para narrativa longa, guia BACH.

Pronto para criar?

Comece a gerar conteúdo incrível com IA

Começar grátis