industryModèles et analyses10 min de lecture

Gemini Omni Flash : ce qui a été livré et ce que Google a retenu

Google a lancé Gemini Omni Flash au I/O 2026 — voici ce que fait le premier modèle Omni, ce qui a été délibérément retenu, et la démarche concrète pour les créateurs sur OmniArt.

Équipe OmniArt12 juin 2026

Note

Mise à jour (13 juillet 2026) : Gemini Omni Flash est désormais disponible dans OmniArt pour la génération vidéo standard à partir de texte et d’images de référence. Les commandes d’édition conversationnelle avec état de Google ne sont pas encore exposées dans l’interface d’OmniArt ; les anciennes mentions de disponibilité ci-dessous reflètent la date de publication initiale.

Google I/O 2026 s'est tenu le 19 mai, et dès la fin du keynote, Gemini Omni Flash était en ligne. Pas « bientôt disponible », pas « aperçu limité » — disponible le jour même. Il y a deux semaines, nous avons publié notre analyse des fuites pré-I/O, en séparant les signaux confirmés de la spéculation. Nous avons maintenant le modèle réel. Voici ce qui a été lancé, ce que Google n'a délibérément pas lancé, et ce que cela signifie pour les créateurs qui ont des livraisons cette semaine.

Omni Flash est le premier modèle public du nouveau framework « Omni » de Google. Ce n'est pas Veo 4, et ce n'est pas un rebranding de Veo 3.1 — c'est une ligne de produit distincte, avec un Omni Pro de niveau supérieur déjà confirmé par Google DeepMind comme suite. Pas de date pour Omni Pro. Flash est la première phase.

Ce qui a été confirmé vs. ce qui a été retenu

L'article sur la fuite décrivait le modèle comme « une vidéo native Gemini avec des ambitions omnimodales ». C'est confirmé. Voici le tableau complet maintenant que la poussière du keynote est retombée.

Fonctionnalité	Statut	Ce que ça signifie pour les créateurs
Clips vidéo de 10 secondes avec audio synchronisé à partir d'un seul prompt	Livré	Le format court pour les réseaux sociaux, les teasers et les génériques trouve naturellement sa place dans cette durée
Entrée de tout type : texte, image, audio et vidéo dans un seul prompt	Livré	Vous pouvez combiner une image de référence, une note vocale et un briefing — une grammaire de prompt pour les trois
Édition conversationnelle (« change l'éclairage », « remplace le chien par un chat »)	Livré	Le changement de workflow que l'article sur la fuite signalait comme le vrai titre — plus de détails ci-dessous
Filigrane SynthID dans chaque output	Livré — non désactivable, aucune option dans l'API	Planifiez des outputs avec filigrane par défaut ; vérifiez les conditions d'utilisation avant toute utilisation commerciale
Édition de la voix ou de l'audio dans la vidéo générée	Retenu pour des raisons de sécurité	Risque lié aux deepfakes ; Google a confirmé que c'est une retenue délibérée, et non une lacune technique
Mode avatar	Retenu	Même catégorie de préoccupation que l'édition audio — aucune date de lancement
API pour développeurs	« Dans les prochaines semaines »	Ne construisez pas un pipeline de production avant que l'API soit en ligne et stable

Avertissement

Deux fonctionnalités importantes — l'édition audio dans la vidéo et le mode avatar — ont été délibérément retenues au lancement, non pour des raisons techniques mais pour des raisons de sécurité. Google l'a confirmé. Si votre pipeline dépend de l'une ou de l'autre, il n'existe pas de solution de contournement et aucune date de lancement n'est prévue.

Google a également reconnu publiquement trois limitations actuelles : la cohérence visuelle pendant les éditions, les séquences de mouvement complexes, et le rendu de texte lisible dans la vidéo. Ce sont les mêmes points faibles que partage l'ensemble de la catégorie vidéo IA ; Omni Flash ne les a pas résolus.

La fuite vs. la réalité

Avant I/O, nous avions décrit trois scénarios pour ce que pourrait être Omni : un rebranding grand public de Veo, un modèle vidéo natif Gemini, ou un véritable système omnimodal unifié. Nous avons jugé « une combinaison des scénarios 2 et 3 » comme le plus probable.

C'était juste. Omni Flash est incontestablement natif de Gemini — il fonctionne dans l'application Gemini et Google Flow, et non comme une surface Veo indépendante — et il est véritablement capable d'accepter n'importe quel type d'entrée. Le positionnement « omnimodal » que Google lui attribue n'est pas du marketing excessif ; combiner texte, image, audio et vidéo dans un seul prompt représente un vrai changement de capacité par rapport au modèle d'entrée de Veo 3.1.

Ce que la spéculation a raté : le cadrage « remix » de la fuite sous-estimait la profondeur de la fonctionnalité d'édition conversationnelle. Ce n'est pas seulement un remix depuis zéro. Elle préserve la cohérence sur plusieurs tours d'édition, ce qui est matériellement différent.

L'édition conversationnelle est le vrai titre

Tous les grands modèles vidéo IA fonctionnent aujourd'hui de la même manière au niveau du workflow : vous écrivez un prompt, vous attendez, vous téléchargez le clip, et vous réécrivez un prompt si ce n'est pas bon. Omni Flash rompt avec cela. La fonctionnalité d'édition conversationnelle vous permet de taper « change l'éclairage en heure dorée » ou « remplace le chien par un chat » et d'obtenir un clip révisé qui maintient la cohérence avec les outputs précédents plutôt que de tout régénérer depuis le début.

C'est important parce que le coût de l'itération en vidéo a toujours été le cycle de régénération — tant en temps qu'en crédits. L'édition multi-tours qui préserve la cohérence comprime l'écart entre un premier jet et un clip finalisé. Cela signifie aussi que le modèle conserve un état sur votre projet d'une manière que les workflows générer-et-jeter ne permettent pas.

Les limites actuelles reconnues sont bien réelles : les séquences de mouvement complexes perdent en cohérence d'une édition à l'autre, et le modèle peut encore dériver sur les détails visuels fins. Mais le principe du workflow est solide, et c'est la fonctionnalité la plus susceptible de bien vieillir à mesure que le modèle sous-jacent s'améliorera.

La place d'Omni Flash dans la gamme

Les points forts d'Omni Flash sont l'accessibilité grand public, l'itération conversationnelle et la flexibilité des entrées multimodales. Ses limites — clips de 10 secondes, pas d'édition vocale, lacunes reconnues sur le mouvement et le rendu de texte — définissent clairement son positionnement.

Le plan nécessite	Utilisez
Itération conversationnelle, affinement par chat	Omni Flash (sur les surfaces Google)
4K natif, audio spatial, finition broadcast	Veo 3.1
Longues prises uniques	Sora 2
Continuité de storyboard multi-plans	Kling, V6 + BACH
Clips rapides, stylisés, à haute énergie	Modèles PixVerse
Rapport qualité-prix à volume	Kling (secondes finalisées de manière rentable)

Pour une analyse approfondie comparant Omni Flash et Veo 3.1 plan par plan, consultez Gemini Omni Flash vs. Veo 3.1 : lequel choisir pour votre workflow.

Où y accéder concrètement

Omni Flash est disponible sur YouTube Shorts, YouTube Create, l'application Gemini et Google Flow. La tarification passe par le niveau d'abonnement IA de Google : AI Plus démarre à environ 7,99 $/mois, et Ultra est passé de 250 $ à 100 $/mois. Une API pour développeurs arrive « dans les prochaines semaines » — sans date précise.

Pour le contexte sur la ligne Veo dans son ensemble, statut du lancement de Veo 4 et place de Veo sur OmniArt couvre ce que Veo 3.1 fait déjà et comment il se situe dans un workspace multi-modèles.

Omni Pro est confirmé — mais sans calendrier

Google DeepMind a confirmé qu'un Omni Pro de niveau supérieur est en préparation, décrit comme « un cran au-dessus de Flash ». Pas de date de lancement, pas de liste de fonctionnalités, pas d'accès anticipé. Planifiez autour de ce qui est livré, pas de ce qui est promis.

Si votre pipeline a une livraison au Q3, construisez-le aujourd'hui sur les spécifications confirmées d'Omni Flash. Quand Omni Pro arrivera, vous l'ajouterez comme option dans un workflow qui produit déjà — vous ne l'attendrez pas, et vous ne refeites pas tout pour lui.

Note

C'est l'argument pour un workspace multi-modèles dans la pratique : les nouvelles sorties sont des ajouts, pas des ruptures. Vous les comparez à ce que vous livrez déjà, pas à ce que vous attendiez.

Quoi faire cette semaine

Omni Flash vit sur les propres surfaces de Google — l'application Gemini, YouTube Shorts, Google Flow. Si vous souhaitez tester l'édition conversationnelle, c'est là qu'il faut aller. Google n'a pas annoncé d'intégrations API tierces au-delà du calendrier développeurs « dans les prochaines semaines ».

Sur OmniArt, vous travaillez dès maintenant avec Veo 3.1 pour le 4K natif et l'audio spatial, et le reste de la gamme — modèles PixVerse, Sora 2, Kling, HappyHorse, Seedance 2 et plus — en image, vidéo, audio et musique dans un seul workspace. Un solde, une grammaire de prompt, un endroit pour comparer les outputs côte à côte.

Pour les étapes pratiques permettant de tirer le meilleur parti de Veo 3.1 pendant que vous évaluez Omni Flash, le guide de prompt et de cinématographie Veo 3.1 couvre l'intégralité du workflow, du briefing au clip finalisé.

La démarche concrète : traitez votre briefing actuel avec les modèles qui sont en ligne et stables. Quand Omni Pro arrivera — ou quand l'API Omni Flash s'ouvrira — vous l'ajoutez à un pipeline qui produit déjà, plutôt que d'attendre pour commencer.

Questions fréquentes

Gemini Omni Flash est-il disponible maintenant ?

Oui. Il a été lancé au Google I/O 2026 le 19 mai 2026 et est devenu disponible le même jour via YouTube Shorts, YouTube Create, l'application Gemini et Google Flow. Une API pour développeurs est décrite comme arrivant « dans les prochaines semaines ».

Quelle est la différence entre Omni Flash et Veo 3.1 ?

Omni Flash est natif de Gemini, accepte des entrées de tout type (texte, image, audio, vidéo dans un seul prompt) et dispose d'une édition conversationnelle multi-tours. Veo 3.1 est un modèle vidéo dédié avec une sortie native en 4K et un audio spatial confirmés. Ils ont des points forts différents et vivent actuellement sur des surfaces distinctes.

Quelles fonctionnalités Google a-t-il retenues d'Omni Flash ?

Deux fonctionnalités ont été délibérément retenues : l'édition de voix et d'audio dans la vidéo, et le mode avatar. Google a confirmé qu'elles ont été retenues pour des raisons de sécurité, et non en raison de limitations techniques. Aucune date de lancement n'est prévue pour l'une ou l'autre.

Gemini Omni Pro va-t-il remplacer Flash ?

Google DeepMind a confirmé Omni Pro comme un futur modèle de niveau supérieur décrit comme « un cran au-dessus de Flash », mais aucune fonctionnalité, tarification ni date de lancement n'ont été divulgués. Planifiez autour des capacités confirmées de Flash ; traitez Omni Pro comme un ajout futur.

Omni Flash intègre-t-il un filigrane SynthID ?

Oui. Chaque output d'Omni Flash inclut un filigrane SynthID. Il ne peut pas être désactivé et n'a pas d'option dans l'API. Vérifiez les conditions d'utilisation de la plateforme avant d'utiliser les outputs dans des contextes commerciaux.

Prêt à créer ?

Commencez à générer du contenu incroyable avec l’IA

Commencer gratuitement