Guia completo de prompts e cinematografia com Veo 3.1
Como usar prompts no Veo 3.1 para resultados em nível broadcast: 4K nativo, áudio espacial e alta aderência ao quadro inicial — com uma fórmula de cinco partes reutilizável e exemplos comparativos no OmniArt.

O Veo 3.1 é o modelo de vídeo em nível broadcast do OmniArt — o que você escolhe quando a saída precisa aguentar uma tela grande. Ele entrega 4K nativo, áudio espacial gerado junto com os frames de vídeo e uma aderência notavelmente forte ao quadro inicial quando você fornece uma imagem de referência. Mas nada disso importa se o prompt for vago. Este guia traz uma fórmula de cinco partes reutilizável para você direcionar o Veo 3.1 do jeito que ele gosta de ser dirigido, além de comparações antes/depois, uma tabela de vocabulário cinematográfico e orientações para escolher o tier certo (padrão, rápido ou lite) para cada trabalho.
A fórmula de cinco partes para prompts no Veo 3.1
O Veo 3.1 responde bem a prompts estruturados que respondem cinco perguntas em ordem. Deixe uma de fora e o modelo preenche a lacuna — geralmente da forma mais genérica possível.
- Sujeito e ação — quem ou o quê, fazendo o quê, onde. "Uma cineasta revisando filmagens sozinha em uma sala de edição escura."
- Câmera (movimento, lente, enquadramento) — tamanho do plano, distância focal, o movimento e sua velocidade. "Lento push-in, 50mm, plano médio fechado, câmera travada depois derivando para frente."
- Iluminação e atmosfera — fonte, direção, qualidade, paleta. "Brilho único de monitor como luz principal, sombras profundas, azul frio, alto contraste."
- Áudio e ambiência — como o espaço soa, sons específicos, direção musical ou
no music. "Zumbido elétrico suave, clique ocasional de teclado, no music." - Saída técnica — resolução (4K ou não), intenção de duração, qualquer referência de estilo. "4K, 8 segundos, fotorrealista."
Um exemplo completamente elaborado
Prompt:
"Uma cineasta revisando filmagens sozinha em uma sala de edição escura. Lento push-in, 50mm, plano médio fechado, câmera travada depois derivando para frente. Brilho único de monitor como luz principal, sombras profundas, azul frio, alto contraste. Zumbido elétrico suave, clique ocasional de teclado, no music. 4K, 8 segundos, fotorrealista."
Esse prompt leva menos de trinta segundos para escrever. Ele especifica o plano da maneira que um diretor de fotografia descreveria a um gaffer, e o Veo 3.1 tem pouco espaço para adivinhar errado.
Dica
no music se quiser um tom de ambiente limpo para mixar depois.Tabela de vocabulário cinematográfico
Esses termos se traduzem diretamente em gerações do Veo 3.1. Copie as frases que precisar para seus prompts.
Movimentos de câmera
| Movimento | Frase para o prompt |
|---|---|
| Aproximação lenta | "slow dolly-in", "gentle push-in" |
| Recuo | "slow pull-back", "dolly-out to reveal" |
| Acompanhar lateralmente | "smooth tracking shot from the left", "lateral dolly" |
| Subir e revelar | "slow crane up to reveal the skyline" |
| Tensão com câmera na mão | "subtle handheld shake, reactive framing" |
| Travado, estável | "tripod-locked", "static wide" |
| Arco ao redor do sujeito | "slow arc around the subject" |
Tamanhos de plano e ângulos
| Intenção | Frase para o prompt |
|---|---|
| Escala e contexto | "wide 18mm, deep focus, full environment" |
| Sujeito no espaço | "medium shot, eye level" |
| Intimidade | "medium close-up, 50mm" |
| Intensidade | "tight close-up, 85mm, shallow focus" |
| Poder e ameaça | "low angle looking up" |
| Vulnerabilidade | "high angle looking down" |
Iluminação
| Visual | Frase para o prompt |
|---|---|
| Calor natural | "golden-hour side light, warm highlights, cool shadows" |
| Contraste dramático | "chiaroscuro, single hard source from camera right" |
| Atmosfera urbana | "neon spill, magenta and cyan, reflections in wet pavement" |
| Entrevista limpa | "soft diffused key, slightly warm, low contrast" |
| Presença noturna | "practical light only — a single lamp, deep background falloff" |
Comparações antes e depois
A: direção de câmera — a alavanca mais importante
A mudança que mais impacta um prompt no Veo 3.1 é adicionar um movimento de câmera e uma distância focal. Compare:
Sem: "A street musician playing violin in the rain."
Com: "Medium close-up of a street musician playing violin in the rain. Slow dolly-in, 85mm, shallow depth of field — background traffic dissolving into blur. Practical street-lamp from above, rim-lighting the bow. Light rain sound, distant traffic, no music."
A segunda versão não usa a palavra "cinematic" nenhuma vez. Ela especifica o que torna o plano cinematográfico — e o modelo renderiza a intenção em vez de escolher uma entre dez interpretações genéricas.
B: aderência ao quadro inicial no fluxo imagem para vídeo
O Veo 3.1 tem aderência de imagem notavelmente forte quando você fornece uma imagem de referência como quadro inicial. O modelo mantém a composição, gradação de cor e detalhes principais do personagem do primeiro frame e os usa como restrição ao longo de toda a geração.
Uso prático: pegue um still de uma filmagem comercial, um render de produto ou um conceito de personagem, forneça como quadro inicial no fluxo de imagem para vídeo do OmniArt e escreva um prompt que descreva o movimento a partir daquele ponto inicial.
Prompt após fornecer um quadro inicial de foto de produto:
"O frasco de perfume repousa sobre uma superfície de mármore branco. Arco lento da esquerda para a direita, com o frasco mantido centralizado. A luz da tarde de uma janela alta varre o vidro, capturando as facetas. 4K, 6 segundos, no music."
O modelo herda a iluminação exata, o posicionamento do produto e a textura da superfície da sua referência e aplica o movimento descrito — em vez de regenerar a cena do zero.
Nota
C: áudio espacial a partir de uma única linha de prompt
O áudio espacial do Veo 3.1 não exige um passo separado — uma linha de áudio descritiva no prompt é suficiente para produzir uma paisagem sonora em camadas e com consciência de posição.
Trecho de prompt:
"...Áudio: chuva de microfone próximo em chapa de ferro corrugado acima, uma multidão de mercado ao fundo, motocicleta ocasional passando da direita para a esquerda, no music."
O que o modelo produz: a chuva é presente e direcional — você a ouve espacialmente acima da cena. A multidão do mercado ocupa o plano médio. A motocicleta atravessa o campo estéreo conforme descrito. A direcionalidade vem da arquitetura de áudio nativa do Veo 3.1, não de pós-processamento. Nomear camadas e suas relações espaciais — close, distant, passing left to right — dá ao modelo o que precisa para renderizar com posicionamento.
Escolhendo entre padrão, rápido e lite
O Veo 3.1 oferece três tiers no OmniArt. A escolha certa depende do trabalho, não de um hábito padrão.
| Tier | Quando usar | Custo em créditos |
|---|---|---|
veo-3.1-standard | Saída final, entrega broadcast, revisão com cliente, qualquer caso de uso em 4K | O mais alto por segundo |
veo-3.1-fast | Iteração e refinamento de prompt com qualidade razoável | Intermediário |
veo-3.1-lite | Testes rápidos de conceito, verificação de thumbnails, passes de movimento para storyboard | O mais baixo por segundo |
Quando o 4K vale os créditos extras: entregas para telas grandes, fotos hero de produto, qualquer coisa que será exportada em resolução total, ou trabalho onde o detalhe de renderização do modelo em fundos e texturas é importante para o briefing. O 4K só está disponível no veo-3.1-standard.
Quando o 4K é desperdício: recortes para redes sociais em 1080p ou menor, rascunhos de movimento que você vai regenerar de qualquer jeito, qualquer coisa que você está explorando em vez de entregando. Use o veo-3.1-lite para esse trabalho — itere de forma econômica, depois mude para o padrão no passe final.
Aviso
Erros comuns de prompt
Sobrecarregar a linha do sujeito. "Uma mulher de meia-idade com cabelo ruivo cacheado usando um casaco vintage parada à beira de um canal em Amsterdã segurando um buquê de tulipas com ar melancólico" coloca detalhes demais na linha do sujeito, forçando o modelo a escolher quais realmente renderizar. Fique só com o que é essencial para este plano e deixe o resto de lado.
Direções de câmera conflitantes. "Slow push-in with a wide pull-back" é fisicamente impossível — o modelo vai escolher um e ignorar o outro. Escreva um único movimento motivado por prompt. Se você precisa de um plano que começa aberto e fecha, é um push-in, ponto final.
Esquecer completamente o áudio. O Veo 3.1 vai gerar áudio com ou sem sua direção. Uma geração de áudio sem direção não é silêncio — é o melhor palpite do modelo, que pode não corresponder à sua intenção. Sempre feche o prompt com uma linha de áudio, mesmo que seja só no music, ambient room tone only.
Escrever "cinematic" como palavra de estilo. A palavra "cinematic" pede que o modelo tome uma decisão que você deveria estar tomando. Substitua pelas propriedades visuais específicas que você realmente quer: lente, luz, movimento, paleta.
Começando no OmniArt
O Veo 3.1 — padrão, rápido e lite — está disponível no espaço de trabalho de vídeo do OmniArt ao lado de todos os outros modelos da biblioteca. A forma mais rápida de ganhar fluência é pegar uma ideia existente, escrever usando a fórmula de cinco partes acima e gerar no veo-3.1-fast primeiro para refinar o prompt antes de confirmar no padrão.
Para o vocabulário cinematográfico mais amplo e como os mesmos padrões de prompt se aplicam em toda a linha de modelos de vídeo do OmniArt, veja o guia de prompts cinematográficos para vídeo com IA. Quando estiver pronto para ir mais fundo na geração de áudio do Veo 3.1 especificamente, o guia de boas práticas de áudio espacial do Veo 3.1 cobre paisagens sonoras em camadas, pistas de áudio posicional e direção musical em detalhes. Para uma comparação direta do Veo 3.1 com outros modelos de ponta, veja Veo 3.1 vs Sora 2.
Pronto para criar?
Comece a gerar conteúdo incrível com IA