Guide complet des prompts et de la cinématographie avec Veo 3.1
Comment rédiger des prompts pour Veo 3.1 afin d'obtenir des résultats de niveau broadcast : 4K natif, audio spatial et forte adhérence à l'image de départ — avec une formule en cinq parties réutilisable et des comparaisons avant/après dans OmniArt.

Veo 3.1 est le modèle vidéo de niveau broadcast d'OmniArt — celui vers lequel vous vous tournez quand le rendu doit résister à une grande surface d'affichage. Il propose un 4K natif, un audio spatial co-généré avec les images vidéo, et une adhérence au premier cadre inhabituellement forte lorsque vous fournissez une image de référence. Mais rien de tout cela n'a d'importance si le prompt est vague. Ce guide vous propose une formule en cinq parties réutilisable pour diriger Veo 3.1 de la façon dont il aime être dirigé, accompagnée de comparaisons avant/après, d'un tableau de vocabulaire cinématographique et de conseils pour choisir le bon niveau (standard, rapide ou lite) selon la tâche.
La formule en cinq parties pour les prompts Veo 3.1
Veo 3.1 répond bien aux prompts structurés qui répondent à cinq questions dans l'ordre. Omettez-en une et le modèle comble le vide — généralement de la façon la plus générique possible.
- Sujet et action — qui ou quoi, fait quoi, où. « Une cinéaste examine des rushes seule dans une salle de montage sombre. »
- Caméra (mouvement, objectif, cadrage) — taille du plan, focale, le mouvement et sa vitesse. « Lent push-in, 50 mm, plan américain serré, caméra bloquée puis dérivant doucement vers l'avant. »
- Éclairage et ambiance — source, direction, qualité, palette. « Lueur d'un seul écran comme lumière principale, ombres profondes, bleu froid, fort contraste. »
- Audio et ambiance sonore — ce que l'espace sonore évoque, sons spécifiques, direction musicale ou
no music. « Bourdonnement électrique discret, cliquetis occasionnel de clavier, no music. » - Rendu technique — résolution (4K ou non), durée souhaitée, toute référence de style. « 4K, 8 secondes, photoréaliste. »
Un exemple entièrement développé
Prompt :
« Une cinéaste examine des rushes seule dans une salle de montage sombre. Lent push-in, 50 mm, plan américain serré, caméra bloquée puis dérivant doucement vers l'avant. Lueur d'un seul écran comme lumière principale, ombres profondes, bleu froid, fort contraste. Bourdonnement électrique discret, cliquetis occasionnel de clavier, no music. 4K, 8 secondes, photoréaliste. »
Ce prompt s'écrit en moins de trente secondes. Il spécifie le plan de la façon dont un directeur de la photographie le décrirait à un gaffer, et Veo 3.1 a peu de marge pour deviner incorrectement.
Astuce
no music si vous souhaitez un ton d'ambiance propre à mixer séparément.Tableau de vocabulaire cinématographique
Ces termes se traduisent directement en générations Veo 3.1. Copiez les phrases dont vous avez besoin dans vos prompts.
Mouvements de caméra
| Mouvement | Phrase pour le prompt |
|---|---|
| Approche lente | "slow dolly-in", "gentle push-in" |
| Recul | "slow pull-back", "dolly-out to reveal" |
| Travelling latéral | "smooth tracking shot from the left", "lateral dolly" |
| Montée et révélation | "slow crane up to reveal the skyline" |
| Tension caméra épaule | "subtle handheld shake, reactive framing" |
| Fixe, stable | "tripod-locked", "static wide" |
| Arc autour du sujet | "slow arc around the subject" |
Tailles de plan et angles
| Intention | Phrase pour le prompt |
|---|---|
| Échelle et contexte | "wide 18mm, deep focus, full environment" |
| Sujet dans l'espace | "medium shot, eye level" |
| Intimité | "medium close-up, 50mm" |
| Intensité | "tight close-up, 85mm, shallow focus" |
| Puissance et menace | "low angle looking up" |
| Vulnérabilité | "high angle looking down" |
Éclairage
| Rendu | Phrase pour le prompt |
|---|---|
| Chaleur naturelle | "golden-hour side light, warm highlights, cool shadows" |
| Contraste dramatique | "chiaroscuro, single hard source from camera right" |
| Atmosphère urbaine | "neon spill, magenta and cyan, reflections in wet pavement" |
| Interview épurée | "soft diffused key, slightly warm, low contrast" |
| Présence nocturne | "practical light only — a single lamp, deep background falloff" |
Comparaisons avant/après
A : la direction de caméra — le levier individuel le plus décisif
Le changement le plus impactant que vous puissiez apporter à un prompt Veo 3.1 est d'y ajouter un mouvement de caméra et une focale. Comparez :
Sans : "A street musician playing violin in the rain."
Avec : "Medium close-up of a street musician playing violin in the rain. Slow dolly-in, 85mm, shallow depth of field — background traffic dissolving into blur. Practical street-lamp from above, rim-lighting the bow. Light rain sound, distant traffic, no music."
La seconde version n'utilise pas une seule fois le mot « cinematic ». Elle précise ce qui rend le plan cinématographique — et le modèle restitue l'intention plutôt que de choisir l'une des dix interprétations génériques.
B : adhérence au premier cadre dans le flux image vers vidéo
Veo 3.1 affiche une adhérence d'image remarquablement forte lorsque vous fournissez une image de référence comme premier cadre. Le modèle conserve la composition, le rendu colorimétrique et les détails clés du premier cadre et les utilise comme contrainte tout au long de la génération.
Application pratique : prenez un fixe d'une séance commerciale, un rendu de produit ou un concept de personnage, fournissez-le comme premier cadre dans le flux image vers vidéo d'OmniArt, puis rédigez un prompt qui décrit le mouvement à partir de ce point de départ.
Prompt après avoir fourni un premier cadre de photo de produit :
« Le flacon de parfum repose sur une surface en marbre blanc. Arc lent de gauche à droite, le flacon restant centré. La lumière de fin d'après-midi d'une haute fenêtre balaie le verre, captant les facettes. 4K, 6 secondes, no music. »
Le modèle hérite de l'éclairage exact, du positionnement du produit et de la texture de la surface de votre référence, et applique le mouvement décrit — plutôt que de régénérer la scène depuis le début.
Note
C : audio spatial à partir d'une seule ligne de prompt
L'audio spatial de Veo 3.1 ne nécessite pas de passe séparée — une seule ligne audio descriptive dans le prompt suffit à produire un paysage sonore en couches avec conscience positionnelle.
Fragment de prompt :
« ...Audio : pluie capturée en micro-proche sur une tôle ondulée en hauteur, une foule de marché au loin, une moto occasionnelle passant de droite à gauche, no music. »
Ce que le modèle produit : la pluie est présente et directionnelle — vous l'entendez spatialement au-dessus de la scène. La foule du marché occupe le plan médian. La moto traverse le champ stéréo comme décrit. La directionnalité provient de l'architecture audio native de Veo 3.1, pas du post-traitement. Nommer les couches et leurs relations spatiales — close, distant, passing left to right — fournit au modèle ce dont il a besoin pour restituer la position.
Choisir entre standard, rapide et lite
Veo 3.1 propose trois niveaux sur OmniArt. Le bon choix dépend du travail, pas d'une habitude par défaut.
| Niveau | Quand l'utiliser | Coût en crédits |
|---|---|---|
veo-3.1-standard | Rendu final, livraison broadcast, révision client, tout cas d'usage en 4K | Le plus élevé par seconde |
veo-3.1-fast | Itération et affinage de prompt à qualité raisonnable | Intermédiaire |
veo-3.1-lite | Tests de concept rapides, vérification de miniatures, passes de mouvement pour storyboard | Le plus bas par seconde |
Quand le 4K vaut les crédits supplémentaires : livrables grand écran, visuels hero de produit, tout ce qui sera exporté en pleine résolution, ou travaux où le rendu des détails du modèle dans les arrière-plans et les textures compte pour le brief. Le 4K n'est disponible que sur veo-3.1-standard.
Quand le 4K est du gaspillage : recadrages pour les réseaux sociaux en 1080p ou moins, ébauches de mouvement que vous allez de toute façon régénérer, tout ce que vous explorez plutôt que livrez. Utilisez veo-3.1-lite pour ce travail — itérez à moindre coût, puis passez au standard pour le rendu final.
Avertissement
Erreurs courantes de prompt
Surcharger la ligne du sujet. « Une femme d'âge moyen aux cheveux roux bouclés portant un manteau vintage debout au bord d'un canal à Amsterdam tenant un bouquet de tulipes avec un air mélancolique » entasse trop de détails dans la ligne du sujet, forçant le modèle à choisir ce qu'il va vraiment rendre. Gardez uniquement ce qui est essentiel pour ce plan et laissez tomber le reste.
Directions de caméra contradictoires. « Slow push-in with a wide pull-back » est physiquement impossible — le modèle choisira l'un et ignorera l'autre. Rédigez un seul mouvement motivé par prompt. Si vous avez besoin d'un plan qui commence large et se resserre, c'est un push-in, point final.
Oublier complètement l'audio. Veo 3.1 générera de l'audio que vous le dirigiez ou non. Une génération audio sans direction n'est pas du silence — c'est la meilleure estimation du modèle, qui peut ne pas correspondre à votre intention. Terminez toujours le prompt par une ligne audio, même si c'est juste no music, ambient room tone only.
Écrire « cinematic » comme mot de style. Le mot « cinematic » demande au modèle de prendre une décision que vous devriez prendre. Remplacez-le par les propriétés visuelles spécifiques que vous voulez vraiment : objectif, lumière, mouvement, palette.
Commencer sur OmniArt
Veo 3.1 — standard, rapide et lite — est disponible dans l'espace de travail vidéo d'OmniArt aux côtés de tous les autres modèles de la bibliothèque. La façon la plus rapide de développer votre maîtrise est de prendre une idée existante, de la rédiger avec la formule en cinq parties ci-dessus et de générer d'abord avec veo-3.1-fast pour affiner le prompt avant de passer au standard.
Pour le vocabulaire cinématographique plus large et comment les mêmes patterns de prompt s'appliquent à toute la gamme de modèles vidéo d'OmniArt, consultez le guide des prompts vidéo cinématographiques pour l'IA. Quand vous serez prêt à approfondir la génération audio de Veo 3.1 spécifiquement, le guide des meilleures pratiques d'audio spatial Veo 3.1 couvre les paysages sonores en couches, les repères audio positionnels et la direction musicale en détail. Pour une comparaison directe de Veo 3.1 face aux autres modèles de premier rang, consultez Veo 3.1 vs Sora 2.
Prêt à créer ?
Commencez à générer du contenu incroyable avec l’IA