industryModelle und Einblicke8 Min. Lesezeit

Gemini Omni Flash: Was geliefert wurde und was Google zurückgehalten hat

Google hat Gemini Omni Flash auf dem I/O 2026 gelauncht — was das erste Omni-Modell leistet, was bewusst zurückgehalten wurde und welche praktischen Schritte Kreative auf OmniArt jetzt unternehmen sollten.

OmniArt-Team12. Juni 2026

Hinweis

Aktualisierung (13. Juli 2026): Gemini Omni Flash ist jetzt in OmniArt für die standardmäßige Videoerzeugung aus Text und Referenzbildern verfügbar. Googles zustandsbehaftete Dialogbearbeitung ist noch nicht in der OmniArt-Oberfläche verfügbar; ältere Verfügbarkeitsangaben unten entsprechen dem ursprünglichen Veröffentlichungsstand.

Google I/O 2026 fand am 19. Mai statt, und noch bevor die Keynote endete, war Gemini Omni Flash live. Nicht „demnächst verfügbar", nicht „begrenzte Vorschau" — am gleichen Tag verfügbar. Vor zwei Wochen veröffentlichten wir unsere Analyse der Pre-I/O-Leaks und trennten bestätigte Signale von Spekulation. Jetzt haben wir das echte Modell. Hier ist, was geliefert wurde, was Google bewusst nicht geliefert hat und was das für Kreative mit Abgaben in dieser Woche bedeutet.

Omni Flash ist das erste öffentliche Modell in Googles neuem „Omni"-Framework. Es ist nicht Veo 4, und es ist kein Rebranding von Veo 3.1 — es ist eine eigenständige Produktlinie, mit einem höherstufigen Omni Pro, das von Google DeepMind bereits als Nachfolger bestätigt wurde. Kein Datum für Omni Pro. Flash ist Phase eins.

Was bestätigt wurde vs. was zurückgehalten wurde

Der Leak-Artikel beschrieb das Modell als „Gemini-natives Video mit omni-modalen Ambitionen". Das hat sich bewahrheitet. Hier das vollständige Bild, nachdem der Keynote-Staub sich gelegt hat.

Funktion	Status	Was das für Kreative bedeutet
10-Sekunden-Videoclips mit synchronem Audio aus einem einzigen Prompt	Veröffentlicht	Kurzform-Social, Trailer und Vorspanntitel sind die natürliche Anwendung für diese Cliplänge
Beliebige Eingaben: Text, Bild, Audio und Video in einem einzigen Prompt	Veröffentlicht	Referenzbild, Sprachnotiz und Briefing lassen sich kombinieren — eine einheitliche Prompt-Grammatik für alle drei
Konversationelle Bearbeitung („Licht ändern", „Hund durch Katze ersetzen")	Veröffentlicht	Der Workflow-Wandel, den der Leak-Artikel als eigentliche Schlagzeile bezeichnete — mehr dazu weiter unten
SynthID-Wasserzeichen in jedem Output	Veröffentlicht — nicht deaktivierbar, kein API-Schalter	Planen Sie standardmäßig Outputs mit Wasserzeichen ein; prüfen Sie die Nutzungsbedingungen vor kommerziellem Einsatz
Bearbeitung von Sprache oder Audio im generierten Video	Aus Sicherheitsgründen zurückgehalten	Deepfake-nahes Risiko; Google hat bestätigt, dass dies eine bewusste Entscheidung ist, keine technische Lücke
Avatar-Modus	Zurückgehalten	Dieselbe Sicherheitskategorie wie Audio-Bearbeitung — kein Zeitplan bekannt
Entwickler-API	„In den kommenden Wochen"	Bauen Sie keine Produktionspipeline auf, bis die API live und stabil ist

Warnung

Zwei bedeutende Funktionen — die In-Video-Audiobearbeitung und der Avatar-Modus — wurden beim Launch bewusst zurückgehalten, nicht aus technischen Gründen, sondern aus Sicherheitserwägungen. Google hat dies bestätigt. Wenn Ihre Pipeline von einer der beiden abhängt, gibt es keinen Workaround und kein Veröffentlichungsdatum.

Google hat außerdem drei aktuelle Einschränkungen öffentlich eingeräumt: visuelle Konsistenz beim Bearbeiten, komplexe Bewegungssequenzen und die Darstellung lesbarer Texte im Video. Das sind dieselben Schwachstellen, die die gesamte KI-Videokategorie teilt; Omni Flash hat sie nicht gelöst.

Leak-Vorhersage vs. Realität

Vor I/O haben wir drei Szenarien für das beschrieben, was Omni sein könnte: ein Consumer-Rebranding von Veo, ein Gemini-natives Videomodell oder ein echtes omni-modales Einheitssystem. Wir bewerteten „eine Mischung aus Szenario 2 und 3" als wahrscheinlichsten Fall.

Das war zutreffend. Omni Flash ist unverkennbar Gemini-nativ — es läuft innerhalb der Gemini-App und Google Flow, nicht als eigenständige Veo-Oberfläche — und es ist tatsächlich beliebige-Eingabe-zu-beliebiger-Ausgabe. Das „omni-modale" Framing, das Google ihm gegeben hat, ist keine Marketing-Übertreibung; Text, Bild, Audio und Video in einem einzigen Prompt zu kombinieren, ist eine echte Fähigkeitsveränderung gegenüber Veo 3.1s Eingabemodell.

Was die Spekulation falsch einschätzte: Das Leak-Framing „Remix" unterschätzte die Tiefe der konversationellen Bearbeitungsfunktion. Es geht nicht nur ums Neu-Remixen von Grund auf. Sie bewahrt die Konsistenz über mehrere Bearbeitungsrunden hinweg, was grundlegend etwas anderes ist.

Konversationelle Bearbeitung ist die eigentliche Schlagzeile

Alle großen KI-Videomodelle heute funktionieren auf Workflow-Ebene gleich: Sie schreiben einen Prompt, warten, laden den Clip herunter und schreiben erneut einen Prompt, wenn das Ergebnis nicht stimmt. Omni Flash bricht damit. Die konversationelle Bearbeitungsfunktion ermöglicht es Ihnen, „Licht auf goldene Stunde ändern" oder „Hund durch Katze ersetzen" einzutippen und einen überarbeiteten Clip zu erhalten, der Konsistenz mit früheren Outputs wahrt, anstatt von Grund auf neu zu generieren.

Das ist wichtig, weil die Iterationskosten bei Video stets im Regenerierungszyklus lagen — sowohl in Zeit als auch in Credits. Mehrstufige Bearbeitung, die Konsistenz bewahrt, verkürzt den Abstand zwischen einem ersten Entwurf und einem fertigen Clip. Es bedeutet auch, dass das Modell einen Zustand über Ihr Projekt hält, den Generieren-und-Verwerfen-Workflows nicht bieten.

Die aktuell anerkannten Einschränkungen sind real: Komplexe Bewegungssequenzen verlieren über Bearbeitungen hinweg an Kohärenz, und das Modell kann bei feingranularen visuellen Details noch abdriften. Aber das Workflow-Prinzip ist solide, und es ist die Funktion, die mit hoher Wahrscheinlichkeit gut altert, wenn das zugrundeliegende Modell sich verbessert.

Wo Omni Flash in der Produktlinie steht

Omni Flashs Stärken liegen in der Verbraucherzugänglichkeit, der konversationellen Iteration und der Flexibilität bei Multi-Modal-Eingaben. Seine Einschränkungen — 10-Sekunden-Clips, keine Sprachbearbeitung, anerkannte Lücken bei Bewegung und Textdarstellung — definieren klar seinen Einsatzbereich.

Die Aufnahme benötigt	Wählen Sie
Konversationelle Iteration, Chat-basierte Verfeinerung	Omni Flash (auf Googles eigenen Oberflächen)
Natives 4K, Raumklang, Broadcast-Qualität	Veo 3.1
Lange Einzeltakes	Sora 2
Multi-Shot-Storyboard-Kontinuität	Kling, V6 + BACH
Schnelle, stilisierte, energiegeladene Clips	PixVerse-Modelle
Kosten-Effizienz im Volumenbereich	Kling (kosteneffiziente Fertigsekunden)

Für einen tieferen Vergleich von Omni Flash und Veo 3.1 Shot für Shot, siehe Gemini Omni Flash vs. Veo 3.1: welches passt zu Ihrem Workflow.

Wo Sie tatsächlich darauf zugreifen können

Omni Flash ist auf YouTube Shorts, YouTube Create, der Gemini-App und Google Flow verfügbar. Die Preisgestaltung läuft über Googles KI-Abonnementstufe: AI Plus beginnt bei etwa 7,99 $/Monat, und Ultra fiel von 250 $ auf 100 $/Monat. Eine Entwickler-API kommt „in den kommenden Wochen" — ohne genaues Datum.

Für Kontext zur Veo-Produktlinie insgesamt deckt Veo 4 Release-Status und wo Veo in OmniArt steht ab, was Veo 3.1 bereits leistet und wie es sich in einen Multi-Modell-Workspace einfügt.

Omni Pro ist bestätigt — aber ohne Zeitplan

Google DeepMind hat bestätigt, dass ein höherstufiges Omni Pro kommt, beschrieben als „eine Stufe über Flash". Kein Veröffentlichungsdatum, keine Funktionsliste, kein Vorab-Zugang. Planen Sie um das, was geliefert wurde, nicht um das, was versprochen wurde.

Wenn Ihre Pipeline eine Q3-Lieferung hat, bauen Sie sie heute auf den bestätigten Spezifikationen von Omni Flash auf. Wenn Omni Pro kommt, fügen Sie es als Option in einen Workflow ein, der bereits produziert — Sie warten nicht darauf, und Sie bauen dafür keine Plattform neu auf.

Hinweis

Das ist der praktische Vorteil eines Multi-Modell-Workspace: Neue Releases sind Ergänzungen, keine Disruptionen. Sie vergleichen sie mit dem, was Sie bereits liefern, nicht mit dem, worauf Sie gewartet haben.

Was diese Woche zu tun ist

Omni Flash läuft auf Googles eigenen Oberflächen — der Gemini-App, YouTube Shorts, Google Flow. Wenn Sie die konversationelle Bearbeitung testen möchten, müssen Sie dorthin. Google hat keine Drittanbieter-API-Integrationen jenseits des „in den kommenden Wochen"-Entwickler-Zeitplans angekündigt.

Auf OmniArt arbeiten Sie heute mit Veo 3.1 für natives 4K und Raumklang sowie dem Rest der Produktlinie — PixVerse-Modelle, Sora 2, Kling, HappyHorse, Seedance 2 und mehr — für Bild, Video, Audio und Musik in einem Workspace. Ein Guthaben, eine Prompt-Grammatik, ein Ort zum Nebeneinandervergleichen von Outputs.

Für praktische Schritte, wie Sie Veo 3.1 optimal nutzen, während Sie Omni Flash evaluieren, deckt der Veo 3.1 Prompt- und Cinematografie-Leitfaden den vollständigen Workflow vom Briefing bis zum fertigen Clip ab.

Der praktische Schritt: Bearbeiten Sie Ihr aktuelles Briefing mit den Modellen, die live und stabil sind. Wenn Omni Pro kommt — oder wenn die Omni Flash API öffnet — fügen Sie es einer Pipeline hinzu, die bereits produziert, anstatt zu warten.

Häufig gestellte Fragen

Ist Gemini Omni Flash jetzt verfügbar?

Ja. Es wurde beim Google I/O 2026 am 19. Mai 2026 gelauncht und noch am gleichen Tag über YouTube Shorts, YouTube Create, die Gemini-App und Google Flow verfügbar. Eine Entwickler-API wird als „in den kommenden Wochen" beschrieben.

Was ist der Unterschied zwischen Omni Flash und Veo 3.1?

Omni Flash ist Gemini-nativ, akzeptiert beliebige Eingaben (Text, Bild, Audio, Video in einem Prompt) und verfügt über konversationelle Multi-Turn-Bearbeitung. Veo 3.1 ist ein dediziertes Videomodell mit bestätigter nativer 4K-Ausgabe und Raumklang. Sie haben unterschiedliche Stärken und laufen derzeit auf verschiedenen Oberflächen.

Welche Funktionen hat Google bei Omni Flash zurückgehalten?

Zwei Fähigkeiten wurden bewusst zurückgehalten: die In-Video-Sprach- und Audiobearbeitung sowie der Avatar-Modus. Google hat bestätigt, dass diese aus Sicherheitsgründen zurückgehalten wurden, nicht wegen technischer Einschränkungen. Es gibt für keine der beiden ein Veröffentlichungsdatum.

Wird Gemini Omni Pro Flash ersetzen?

Google DeepMind hat Omni Pro als zukünftiges höherstufiges Modell bestätigt, beschrieben als „eine Stufe über Flash", aber keine Funktionen, Preisgestaltung oder Veröffentlichungsdatum wurden bekannt gegeben. Planen Sie auf Basis der bestätigten Fähigkeiten von Flash; behandeln Sie Omni Pro als zukünftige Ergänzung.

Hat Omni Flash ein SynthID-Wasserzeichen?

Ja. Jeder Omni Flash Output enthält ein SynthID-Wasserzeichen. Es ist nicht deaktivierbar und hat keinen API-Schalter. Prüfen Sie die Nutzungsbedingungen der Plattform, bevor Sie Outputs in kommerziellen Kontexten verwenden.

Bereit zum Erstellen?

Starte mit KI die Erstellung beeindruckender Inhalte

Kostenlos starten