guideTutorials und Anleitungen8 Min. Lesezeit

Veo 3.1 Prompt-Leitfaden: Kinoreife Videos mit KI erstellen

Wie Sie Veo 3.1 mit Prompts für broadcast-taugliche Ergebnisse steuern: natives 4K, räumliches Audio und starke Startbild-Treue — mit einer wiederverwendbaren Fünf-Teile-Formel und Vorher/Nachher-Vergleichen in OmniArt.

OmniArt-Team
Veo 3.1 Prompt-Leitfaden: Kinoreife Videos mit KI erstellen

Veo 3.1 ist OmniArts Videomodell auf Broadcast-Niveau — das Modell, das Sie wählen, wenn das Ergebnis auf einem großen Bildschirm bestehen muss. Es bietet natives 4K, räumliches Audio, das zusammen mit den Videobildern generiert wird, und eine ungewöhnlich starke Startbild-Treue, wenn Sie ein Referenzbild bereitstellen. All das nützt jedoch nichts, wenn der Prompt vage ist. Dieser Leitfaden liefert eine wiederverwendbare Fünf-Teile-Formel, um Veo 3.1 so zu dirigieren, wie es am besten funktioniert — ergänzt durch Vorher/Nachher-Vergleiche, eine Tabelle mit Filmterminologie und Hilfe bei der Wahl des richtigen Tiers (Standard, Fast oder Lite) für den jeweiligen Job.

Die Fünf-Teile-Formel für Veo 3.1-Prompts

Veo 3.1 reagiert gut auf strukturierte Prompts, die fünf Fragen der Reihe nach beantworten. Lassen Sie eine aus, füllt das Modell die Lücke — meistens auf die generischste Art.

  1. Subjekt und Handlung — wer oder was, macht was, wo. „Eine Filmemacherin sichtet allein in einem dunklen Schnittraum Aufnahmen."
  2. Kamera (Bewegung, Objektiv, Bildausschnitt) — Einstellungsgröße, Brennweite, die Bewegung und ihre Geschwindigkeit. „Langsamer Push-in, 50 mm, halbnahe Einstellung, Kamera zunächst statisch, dann sanft nach vorne gleitend."
  3. Licht und Stimmung — Quelle, Richtung, Qualität, Farbpalette. „Einzelner Monitor als Hauptlichtquelle, tiefe Schatten, kühles Blau, hoher Kontrast."
  4. Audio und Ambiente — wie der Raum klingt, bestimmte Geräusche, Musikrichtung oder no music. „Leises elektrisches Surren, gelegentliches Tastaturklicken, no music."
  5. Technische Ausgabe — Auflösung (4K oder nicht), angestrebte Länge, etwaige Stilreferenz. „4K, 8 Sekunden, fotorealistisch."

Ein vollständig ausgearbeitetes Beispiel

Prompt:

„Eine Filmemacherin sichtet allein in einem dunklen Schnittraum Aufnahmen. Langsamer Push-in, 50 mm, halbnahe Einstellung, Kamera zunächst statisch, dann sanft nach vorne gleitend. Einzelner Monitor als Hauptlichtquelle, tiefe Schatten, kühles Blau, hoher Kontrast. Leises elektrisches Surren, gelegentliches Tastaturklicken, no music. 4K, 8 Sekunden, fotorealistisch."

Dieser Prompt ist in unter dreißig Sekunden geschrieben. Er beschreibt die Einstellung so, wie ein Kameramann sie einem Beleuchter erklären würde — damit hat Veo 3.1 kaum Spielraum für Fehlannahmen.

Tipp

Fügen Sie jedem Prompt eine Audio-Anweisung hinzu, nicht nur denen, bei denen Ton explizit wichtig ist. Veo 3.1 generiert räumliches Audio zusammen mit den Videobildern — keine Audioangabe bedeutet nicht Stille, sondern dass das Modell die Kontrolle übernimmt. Schreiben Sie no music, wenn Sie einen sauberen Raumton zum separaten Abmischen wollen.

Filmterminologie als Spickzettel

Diese Begriffe lassen sich direkt in Veo 3.1-Generierungen übersetzen. Kopieren Sie die benötigten Formulierungen in Ihre Prompts.

Kamerabewegungen

BewegungPrompt-Formulierung
Langsame Annäherung"slow dolly-in", "gentle push-in"
Rückzug"slow pull-back", "dolly-out to reveal"
Seitwärts verfolgen"smooth tracking shot from the left", "lateral dolly"
Aufstieg und Enthüllung"slow crane up to reveal the skyline"
Handkamera-Spannung"subtle handheld shake, reactive framing"
Fest, stabil"tripod-locked", "static wide"
Bogen um das Subjekt"slow arc around the subject"

Einstellungsgrößen und Winkel

AbsichtPrompt-Formulierung
Maßstab und Kontext"wide 18mm, deep focus, full environment"
Subjekt im Raum"medium shot, eye level"
Intimität"medium close-up, 50mm"
Intensität"tight close-up, 85mm, shallow focus"
Macht und Bedrohung"low angle looking up"
Verletzlichkeit"high angle looking down"

Lichtgestaltung

WirkungPrompt-Formulierung
Natürliche Wärme"golden-hour side light, warm highlights, cool shadows"
Dramatischer Kontrast"chiaroscuro, single hard source from camera right"
Urbane Atmosphäre"neon spill, magenta and cyan, reflections in wet pavement"
Sauberes Interview-Licht"soft diffused key, slightly warm, low contrast"
Nächtliche Präsenz"practical light only — a single lamp, deep background falloff"

Vorher/Nachher-Vergleiche

A: Kameraführung — der wirkungsstärkste einzelne Hebel

Die wirkungsvollste Änderung an einem Veo 3.1-Prompt ist das Hinzufügen einer Kamerabewegung und einer Brennweite. Vergleichen Sie:

Ohne: "A street musician playing violin in the rain."

Mit: "Medium close-up of a street musician playing violin in the rain. Slow dolly-in, 85mm, shallow depth of field — background traffic dissolving into blur. Practical street-lamp from above, rim-lighting the bow. Light rain sound, distant traffic, no music."

Die zweite Version verwendet das Wort „cinematic" kein einziges Mal. Sie legt fest, was die Einstellung filmisch macht — und das Modell rendert die Absicht, statt eine von zehn generischen Interpretationen zu wählen.

B: Startbild-Treue im Bild-zu-Video-Workflow

Wenn Sie ein Referenzbild als Startbild bereitstellen, zeigt Veo 3.1 eine besonders starke Bild-Treue. Das Modell übernimmt Komposition, Farbgebung und Schlüsseldetails des Charakters aus dem ersten Bild und nutzt sie als Einschränkung während der gesamten Generierung.

Praktische Anwendung: Nehmen Sie ein Standbild von einem Werbedreh, einen Produkt-Render oder ein Charakter-Konzept, stellen Sie es als Startbild im Bild-zu-Video-Workflow von OmniArt bereit, und schreiben Sie dann einen Prompt, der die Bewegung ausgehend von diesem Ausgangspunkt beschreibt.

Prompt nach der Angabe eines Produkt-Startbilds:

„Der Parfümflakon steht auf einer weißen Marmoroberfläche. Langsamer Bogen von links nach rechts, der Flakon bleibt zentriert. Nachmittagslicht durch ein hohes Fenster zieht über das Glas und erfasst die Facetten. 4K, 6 Sekunden, no music."

Das Modell übernimmt exakt die Beleuchtung, Produktpositionierung und Oberflächentextur Ihrer Referenz und wendet die beschriebene Bewegung darauf an — anstatt die Szene von Grund auf neu zu generieren.

Hinweis

Die Bild-Treue ist am stärksten, wenn Ihr Startbild dem Seitenverhältnis und der Auflösung der gewünschten Ausgabe nahe kommt. Ein quadratisches Bild für eine 16:9-Generierung wird beschnitten oder erhält Seitenbalken, was die übernommene Komposition verschieben kann.

C: Räumliches Audio aus einer einzelnen Prompt-Zeile

Das räumliche Audio von Veo 3.1 erfordert keinen separaten Durchlauf — eine beschreibende Audiozeile im Prompt reicht aus, um eine mehrschichtige, positionsbewusste Klanglandschaft zu erzeugen.

Prompt-Fragment:

„...Audio: nahe aufgenommener Regen auf Wellblech direkt darüber, ein entfernter Markttrubel, gelegentlich ein vorbeifahrendes Motorrad von rechts nach links, no music."

Was das Modell produziert: Der Regen ist präsent und gerichtet — Sie hören ihn räumlich über der Szene. Der Marktlärm belegt die mittlere Entfernung. Das Motorrad durchquert das Stereofeld wie beschrieben. Die Direktionalität kommt aus der nativen Audio-Architektur von Veo 3.1, nicht aus der Nachbearbeitung. Schichten und ihre räumlichen Beziehungen zu benennen — close, distant, passing left to right — gibt dem Modell, was es für eine positionsbewusste Wiedergabe benötigt.

Wahl zwischen Standard, Fast und Lite

Veo 3.1 bietet auf OmniArt drei Tiers. Die richtige Wahl hängt von der Aufgabe ab, nicht von einer Standardgewohnheit.

TierWann verwendenKosten in Credits
veo-3.1-standardEndausgabe, Broadcast-Lieferung, Kunden-Review, jeder 4K-AnwendungsfallHöchste pro Sekunde
veo-3.1-fastIteration und Prompt-Verfeinerung bei akzeptabler QualitätMittelbereich
veo-3.1-liteSchnelle Konzepttests, Thumbnail-Checks, Storyboard-Motion-PassesNiedrigste pro Sekunde

Wann 4K die Extra-Credits wert ist: Lieferobjekte für große Bildschirme, Produkt-Hero-Shots, alles, was in voller Auflösung exportiert wird, oder Arbeiten, bei denen die Detail-Wiedergabe des Modells in Hintergründen und Texturen für den Auftrag entscheidend ist. 4K ist nur auf veo-3.1-standard verfügbar.

Wann 4K verschwendet ist: Social-Media-Ausschnitte in 1080p oder kleiner, Motion-Entwürfe, die Sie sowieso regenerieren, alles, was Sie erkunden statt liefern. Verwenden Sie veo-3.1-lite für diese Arbeit — iterieren Sie günstig, dann wechseln Sie für den finalen Durchlauf zu Standard.

Warnung

4K bei einem explorativen Prompt, den Sie mehrfach regenerieren werden, multipliziert den Credit-Verbrauch schnell. Finalisieren Sie den Prompt zuerst mit Fast oder Lite, und committen Sie dann die finale Version mit Standard auf 4K.

Häufige Prompt-Fehler

Das Subjekt überladen. „Eine mittelalte Frau mit lockigem rotem Haar in einem Vintage-Mantel, die an einem Kanal in Amsterdam steht, einen Tulpenstrauß hält und nachdenklich dreinblickt" häuft so viele Details in der Subjektzeile auf, dass das Modell selbst wählen muss, was es tatsächlich rendert. Behalten Sie nur das Wesentliche für diese Einstellung und lassen Sie den Rest los.

Widersprüchliche Kameraangaben. „Slow push-in with a wide pull-back" ist physikalisch unmöglich — das Modell wählt eine Option und ignoriert die andere. Schreiben Sie pro Prompt eine einzige motivierte Bewegung. Wenn Sie eine Einstellung brauchen, die von weit startet und näher kommt, ist das ein Push-in, fertig.

Audio völlig vergessen. Veo 3.1 generiert Audio, ob Sie es dirigieren oder nicht. Eine ungeleitete Audio-Generierung ist nicht Stille — es ist die beste Schätzung des Modells, die möglicherweise nicht Ihrer Absicht entspricht. Schließen Sie den Prompt immer mit einer Audiozeile ab, auch wenn es nur no music, ambient room tone only ist.

„Cinematic" als Stilwort verwenden. Das Wort „cinematic" bittet das Modell, eine Entscheidung zu treffen, die Sie treffen sollten. Ersetzen Sie es durch die spezifischen visuellen Eigenschaften, die Sie wirklich wollen: Objektiv, Licht, Bewegung, Farbpalette.

Einstieg in OmniArt

Veo 3.1 — Standard, Fast und Lite — ist im OmniArt-Video-Arbeitsbereich neben allen anderen Modellen der Bibliothek verfügbar. Der schnellste Weg, Sicherheit zu gewinnen, ist: nehmen Sie eine vorhandene Idee, schreiben Sie sie mit der Fünf-Teile-Formel oben, generieren Sie zunächst mit veo-3.1-fast, um den Prompt zu verfeinern, und wechseln Sie dann zu Standard für die finale Ausgabe.

Für das breitere kinematografische Vokabular und wie dieselben Prompt-Muster auf OmniArts gesamtes Videomodell-Lineup angewendet werden, lesen Sie den Leitfaden für kinematografische KI-Video-Prompts. Wenn Sie bereit sind, tiefer in die Audio-Generierung von Veo 3.1 einzusteigen, deckt der Leitfaden für räumliches Audio mit Veo 3.1 mehrschichtige Klanglandschaften, positionelle Audio-Hinweise und Musikrichtung im Detail ab. Für einen direkten Vergleich von Veo 3.1 mit anderen Top-Modellen lesen Sie Veo 3.1 vs Sora 2.

Bereit zum Erstellen?

Starte mit KI die Erstellung beeindruckender Inhalte

Kostenlos starten