Guida completa ai prompt e alla cinematografia con Veo 3.1
Come scrivere prompt per Veo 3.1 per ottenere risultati di livello broadcast: 4K nativo, audio spaziale e forte aderenza al frame iniziale — con una formula in cinque parti riutilizzabile e confronti prima/dopo su OmniArt.

Veo 3.1 è il modello video di livello broadcast di OmniArt — quello a cui ricorri quando l'output deve reggere su uno schermo grande. Offre 4K nativo, audio spaziale generato insieme ai frame video, e un'aderenza al frame iniziale insolitamente forte quando fornisci un'immagine di riferimento. Ma tutto questo non conta nulla se il prompt è vago. Questa guida ti fornisce una formula riutilizzabile in cinque parti per dirigere Veo 3.1 nel modo in cui preferisce essere guidato, insieme a confronti prima/dopo, una tabella di vocabolario cinematografico e indicazioni per scegliere il livello giusto (standard, fast o lite) per ogni lavoro.
La formula in cinque parti per i prompt di Veo 3.1
Veo 3.1 risponde bene ai prompt strutturati che rispondono a cinque domande in ordine. Lasciarne una fuori e il modello riempirà il vuoto — di solito nel modo più generico possibile.
- Soggetto e azione — chi o cosa, fa cosa, dove. «Una regista esamina il girato da sola in una sala di montaggio buia.»
- Macchina da presa (movimento, obiettivo, inquadratura) — grandezza del piano, lunghezza focale, il movimento e la sua velocità. «Lento push-in, 50mm, piano americano stretto, camera fissa poi che scivola in avanti.»
- Luce e atmosfera — sorgente, direzione, qualità, palette. «Bagliore di un unico monitor come luce chiave, ombre profonde, blu freddo, alto contrasto.»
- Audio e ambienza — il suono dello spazio, suoni specifici, direzione musicale o
no music. «Ronzio elettrico leggero, clic occasionale di tastiera, no music.» - Output tecnico — risoluzione (4K o no), durata prevista, eventuale riferimento stilistico. «4K, 8 secondi, fotorealistico.»
Un esempio completamente sviluppato
Prompt:
«Una regista esamina il girato da sola in una sala di montaggio buia. Lento push-in, 50mm, piano americano stretto, camera fissa poi che scivola in avanti. Bagliore di un unico monitor come luce chiave, ombre profonde, blu freddo, alto contrasto. Ronzio elettrico leggero, clic occasionale di tastiera, no music. 4K, 8 secondi, fotorealistico.»
Questo prompt richiede meno di trenta secondi per essere scritto. Specifica il piano nel modo in cui un direttore della fotografia lo descriverebbe a un gaffer, e Veo 3.1 ha poco margine per indovinare in modo errato.
Suggerimento
no music se vuoi un tono ambiente pulito da mixare separatamente.Tabella del vocabolario cinematografico
Questi termini si traducono direttamente nelle generazioni di Veo 3.1. Copia le frasi di cui hai bisogno nei tuoi prompt.
Movimenti di macchina
| Movimento | Frase per il prompt |
|---|---|
| Avvicinamento lento | "slow dolly-in", "gentle push-in" |
| Allontanamento | "slow pull-back", "dolly-out to reveal" |
| Carrellata laterale | "smooth tracking shot from the left", "lateral dolly" |
| Salita e rivelazione | "slow crane up to reveal the skyline" |
| Tensione in spalla | "subtle handheld shake, reactive framing" |
| Bloccata, stabile | "tripod-locked", "static wide" |
| Arco intorno al soggetto | "slow arc around the subject" |
Grandezze di piano e angolazioni
| Intenzione | Frase per il prompt |
|---|---|
| Scala e contesto | "wide 18mm, deep focus, full environment" |
| Soggetto nello spazio | "medium shot, eye level" |
| Intimità | "medium close-up, 50mm" |
| Intensità | "tight close-up, 85mm, shallow focus" |
| Potenza e minaccia | "low angle looking up" |
| Vulnerabilità | "high angle looking down" |
Illuminazione
| Look | Frase per il prompt |
|---|---|
| Calore naturale | "golden-hour side light, warm highlights, cool shadows" |
| Contrasto drammatico | "chiaroscuro, single hard source from camera right" |
| Atmosfera urbana | "neon spill, magenta and cyan, reflections in wet pavement" |
| Intervista pulita | "soft diffused key, slightly warm, low contrast" |
| Presenza notturna | "practical light only — a single lamp, deep background falloff" |
Confronti prima e dopo
A: la direzione della macchina da presa — la leva individuale più potente
Il cambiamento più impattante che puoi apportare a un prompt di Veo 3.1 è aggiungere un movimento di macchina e una lunghezza focale. Confronta:
Senza: "A street musician playing violin in the rain."
Con: "Medium close-up of a street musician playing violin in the rain. Slow dolly-in, 85mm, shallow depth of field — background traffic dissolving into blur. Practical street-lamp from above, rim-lighting the bow. Light rain sound, distant traffic, no music."
La seconda versione non usa la parola «cinematic» nemmeno una volta. Specifica cosa rende il piano cinematografico — e il modello rende l'intenzione invece di scegliere una tra dieci interpretazioni generiche.
B: aderenza al frame iniziale nel flusso da immagine a video
Veo 3.1 ha un'aderenza all'immagine notevolmente forte quando si fornisce un'immagine di riferimento come frame iniziale. Il modello mantiene la composizione, il color grade e i dettagli chiave del personaggio dal primo frame e li usa come vincolo per tutta la generazione.
Uso pratico: prendi un'immagine fissa da un set commerciale, un render di prodotto o un concept di personaggio, forniscila come frame iniziale nel flusso da immagine a video di OmniArt, poi scrivi un prompt che descrive il movimento da quel punto di partenza.
Prompt dopo aver fornito un frame iniziale con una foto di prodotto:
«Il flacone di profumo è posato su una superficie di marmo bianco. Arco lento da sinistra a destra, il flacone rimane centrato. La luce del tardo pomeriggio da una finestra alta scorre sul vetro, catturando le sfaccettature. 4K, 6 secondi, no music.»
Il modello eredita l'illuminazione esatta, il posizionamento del prodotto e la texture della superficie dal tuo riferimento e applica il movimento descritto — invece di rigenerare la scena da zero.
Nota
C: audio spaziale da una singola riga di prompt
L'audio spaziale di Veo 3.1 non richiede un passaggio separato — una riga audio descrittiva nel prompt è sufficiente per produrre un paesaggio sonoro stratificato e consapevole della posizione.
Frammento di prompt:
«...Audio: pioggia registrata in close-up su lamiera ondulata in alto, una folla di mercato in lontananza, una moto che passa di tanto in tanto da destra a sinistra, no music.»
Cosa produce il modello: la pioggia è presente e direzionale — la senti spazialmente sopra la scena. La folla del mercato occupa il piano medio. La moto attraversa il campo stereo come descritto. La direzionalità proviene dall'architettura audio nativa di Veo 3.1, non dalla post-produzione. Nominare i layer e le loro relazioni spaziali — close, distant, passing left to right — fornisce al modello ciò di cui ha bisogno per il rendering posizionale.
Scegliere tra standard, fast e lite
Veo 3.1 offre tre livelli su OmniArt. La scelta giusta dipende dal lavoro, non da un'abitudine predefinita.
| Livello | Quando usarlo | Costo in crediti |
|---|---|---|
veo-3.1-standard | Output finale, consegna broadcast, revisione con il cliente, qualsiasi caso d'uso in 4K | Il più alto al secondo |
veo-3.1-fast | Iterazione e perfezionamento del prompt a qualità ragionevole | Intermedio |
veo-3.1-lite | Test di concetto rapidi, controllo delle miniature, motion pass per storyboard | Il più basso al secondo |
Quando il 4K vale i crediti aggiuntivi: materiali per schermi grandi, hero shot di prodotto, tutto ciò che sarà esportato a piena risoluzione, o lavori in cui il rendering dei dettagli nelle sfondi e nelle texture è importante per il brief. Il 4K è disponibile solo su veo-3.1-standard.
Quando il 4K è uno spreco: ritagli per i social a 1080p o inferiori, bozze di movimento che tanto rigenererai, qualsiasi cosa che stai esplorando invece di consegnare. Usa veo-3.1-lite per quel lavoro — itera a basso costo, poi passa allo standard per il passaggio finale.
Avviso
Errori comuni nei prompt
Sovraccaricare la riga del soggetto. «Una donna di mezza età con i capelli rossi ricci che indossa un cappotto vintage in piedi accanto a un canale ad Amsterdam con un mazzo di tulipani dall'aria malinconica» carica così tanti dettagli che il modello deve scegliere da solo cosa rendere davvero. Tieni solo ciò che è essenziale per questo piano e lascia andare il resto.
Direzioni di macchina in conflitto. «Slow push-in with a wide pull-back» è fisicamente impossibile — il modello ne sceglierà uno e ignorerà l'altro. Scrivi un solo movimento motivato per prompt. Se hai bisogno di un piano che inizia largo e si avvicina, quello è un push-in, punto.
Dimenticare completamente l'audio. Veo 3.1 genererà audio che tu lo indichi o no. Una generazione audio non guidata non è silenzio — è la migliore ipotesi del modello, che potrebbe non corrispondere alla tua intenzione. Chiudi sempre il prompt con una riga audio, anche solo no music, ambient room tone only.
Scrivere «cinematic» come parola di stile. La parola «cinematic» chiede al modello di prendere una decisione che dovresti prendere tu. Sostituiscila con le proprietà visive specifiche che vuoi davvero: obiettivo, luce, movimento, palette.
Iniziare su OmniArt
Veo 3.1 — standard, fast e lite — è disponibile nello spazio di lavoro video di OmniArt insieme a tutti gli altri modelli della libreria. Il modo più rapido per acquisire padronanza è prendere un'idea esistente, scriverla usando la formula in cinque parti qui sopra e generare prima su veo-3.1-fast per affinare il prompt prima di passare allo standard.
Per il vocabolario cinematografico più ampio e come gli stessi pattern di prompt si applicano all'intera gamma di modelli video di OmniArt, consulta la guida ai prompt per video AI cinematografici. Quando sei pronto ad approfondire la generazione audio di Veo 3.1 nello specifico, la guida alle best practice per l'audio spaziale di Veo 3.1 copre paesaggi sonori stratificati, segnali audio posizionali e direzione musicale in dettaglio. Per un confronto diretto tra Veo 3.1 e altri modelli di punta, consulta Veo 3.1 vs Sora 2.
Pronto a creare?
Inizia a generare contenuti straordinari con l’AI