industryModelli e insight9 min di lettura

Gemini Omni Flash: cosa è stato rilasciato e cosa Google ha trattenuto

Google ha lanciato Gemini Omni Flash al I/O 2026 — ecco cosa fa il primo modello Omni, cosa è stato deliberatamente trattenuto e quale mossa concreta fare per i creator su OmniArt.

Team OmniArt
Gemini Omni Flash: cosa è stato rilasciato e cosa Google ha trattenuto

Google I/O 2026 si è tenuto il 19 maggio e, al termine del keynote, Gemini Omni Flash era già disponibile. Non «prossimamente», non «anteprima limitata» — disponibile lo stesso giorno. Due settimane fa abbiamo pubblicato la nostra analisi delle anticipazioni pre-I/O, separando i segnali confermati dalla speculazione. Ora abbiamo il modello reale. Ecco cosa è stato rilasciato, cosa Google ha deliberatamente non rilasciato e cosa significa per i creator con scadenze questa settimana.

Omni Flash è il primo modello pubblico nel nuovo framework «Omni» di Google. Non è Veo 4, e non è un rebranding di Veo 3.1 — è una linea di prodotto separata, con un Omni Pro di livello superiore già confermato da Google DeepMind come passo successivo. Nessuna data per Omni Pro. Flash è la fase uno.

Cosa è stato confermato e cosa è stato trattenuto

L'articolo sulle anticipazioni descriveva il modello come «video nativo di Gemini con ambizioni omni-modali». Quella previsione ha retto bene. Ecco il quadro completo ora che la polvere del keynote si è posata.

FunzionalitàStatoCosa significa per i creator
Clip video di 10 secondi con audio sincronizzato da un singolo promptRilasciatoShort-form per i social, trailer e ident sono l'uso naturale per questa durata di clip
Input di qualsiasi tipo: testo, immagine, audio e video in un unico promptRilasciatoPuoi passare un'immagine di riferimento, una nota vocale e un briefing — una grammatica di prompt per tutti e tre
Editing conversazionale («cambia l'illuminazione», «sostituisci il cane con un gatto»)RilasciatoIl cambiamento di flusso di lavoro che l'articolo sulle anticipazioni indicava come il vero titolo — più dettagli di seguito
Watermark SynthID in ogni outputRilasciato — non disattivabile, nessun toggle APIPianifica output con watermark di default; verifica le condizioni d'uso prima dell'utilizzo commerciale
Modifica di voce o audio all'interno del video generatoTrattenuto per ragioni di sicurezzaRischio legato ai deepfake; Google ha confermato che si tratta di una scelta deliberata, non di un limite tecnico
Modalità avatarTrattenutoStessa categoria di preoccupazione della modifica audio — nessuna data comunicata
API per sviluppatori«Nelle prossime settimane»Non costruire un pipeline di produzione finché l'API non è live e stabile

Avviso

Due funzionalità significative — la modifica audio nel video e la modalità avatar — sono state deliberatamente trattenute al lancio, non per ragioni tecniche ma per la sicurezza. Google lo ha confermato ufficialmente. Se il tuo pipeline dipende da una delle due, non esiste alcun workaround e non c'è una data di rilascio.

Google ha inoltre riconosciuto pubblicamente tre limitazioni attuali: la coerenza visiva durante le modifiche, le sequenze di movimenti complessi e il rendering di testo leggibile nel video. Sono gli stessi punti deboli condivisi dall'intera categoria dei video generati da IA; Omni Flash non li ha risolti.

Le anticipazioni a confronto con la realtà

Prima del I/O abbiamo delineato tre scenari su cosa avrebbe potuto essere Omni: un rebranding consumer di Veo, un modello video nativo di Gemini, o un sistema omni-modale unificato autentico. Abbiamo indicato «una fusione degli scenari 2 e 3» come il più probabile.

Era un'analisi accurata. Omni Flash è inconfondibilmente nativo di Gemini — gira all'interno dell'app Gemini e di Google Flow, non come superficie Veo indipendente — ed è genuinamente capace di accettare qualsiasi tipo di input. L'etichetta «omni-modale» che Google gli ha attribuito non è esagerazione di marketing; combinare testo, immagine, audio e video in un unico prompt è un cambiamento reale di capacità rispetto al modello di input di Veo 3.1.

Cosa la speculazione ha sbagliato: il framing «remix» della fuga di notizie sottovalutava la profondità della funzionalità di editing conversazionale. Non si tratta solo di remixare da zero. Preserva la coerenza attraverso modifiche su più turni, che è qualcosa di materialmente diverso.

L'editing conversazionale è il vero titolo

Tutti i principali modelli video IA oggi funzionano allo stesso modo a livello di flusso di lavoro: scrivi un prompt, aspetti, scarichi il clip e riscrivi il prompt se non va bene. Omni Flash rompe questo schema. La funzionalità di editing conversazionale ti permette di digitare «cambia l'illuminazione all'ora dorata» o «sostituisci il cane con un gatto» e ottenere un clip revisionato che mantiene la coerenza con gli output precedenti invece di rigenerare da zero.

Questo è importante perché il costo dell'iterazione nel video è sempre stato nel ciclo di rigenerazione — sia in termini di tempo che di crediti. L'editing multi-turno che preserva la coerenza comprime il gap tra una prima bozza e un clip finito. Significa anche che il modello conserva lo stato del tuo progetto in un modo che i flussi di lavoro genera-e-scarta non hanno.

I limiti attuali riconosciuti sono reali: le sequenze di movimenti complessi perdono coerenza attraverso le modifiche, e il modello può ancora derivare su dettagli visivi fini. Ma il principio del flusso di lavoro è solido, ed è la funzionalità più probabile di invecchiare bene man mano che il modello sottostante migliora.

Dove si posiziona Omni Flash nella lineup

I punti di forza di Omni Flash sono l'accessibilità consumer, l'iterazione conversazionale e la flessibilità dell'input multimodale. I suoi limiti — clip da 10 secondi, nessuna modifica vocale, lacune riconosciute su movimento e rendering del testo — definiscono chiaramente la sua corsia.

La ripresa richiedeUsa
Iterazione conversazionale, rifinitura via chatOmni Flash (sulle superfici di Google)
4K nativo, audio spaziale, finitura broadcastVeo 3.1
Riprese singole lungheSora 2
Continuità di storyboard multi-shotKling, V6 + BACH
Clip veloci, stilizzati, ad alta energiaModelli PixVerse
Valore in volumeKling (secondi finiti a costo efficiente)

Per un approfondimento che confronta Omni Flash e Veo 3.1 inquadratura per inquadratura, vedi Gemini Omni Flash vs. Veo 3.1: quale scegliere per il tuo flusso di lavoro.

Dove accedervi concretamente

Omni Flash è disponibile su YouTube Shorts, YouTube Create, l'app Gemini e Google Flow. Il prezzo passa attraverso il livello di abbonamento IA di Google: AI Plus parte da circa $7,99/mese, e Ultra è sceso da $250 a $100/mese. Un'API per sviluppatori arriverà «nelle prossime settimane» — senza data precisa.

Per il contesto sulla linea Veo nel suo insieme, stato del lancio di Veo 4 e dove si posiziona Veo su OmniArt copre cosa già fa Veo 3.1 e come si inserisce in uno workspace multi-modello.

Omni Pro è confermato — ma senza calendario

Google DeepMind ha confermato che un Omni Pro di livello superiore è in arrivo, descritto come «un salto sopra Flash». Nessuna data di rilascio, nessuna lista di funzionalità, nessun accesso in anteprima. Pianifica attorno a ciò che è stato rilasciato, non a ciò che è stato promesso.

Se il tuo pipeline ha una consegna nel Q3, costruiscilo oggi sulle specifiche confermate di Omni Flash. Quando Omni Pro arriverà, lo aggiungerai come opzione all'interno di un flusso di lavoro che sta già producendo — non lo aspetti, e non rifai la piattaforma per lui.

Nota

Questo è il caso concreto per uno workspace multi-modello: i nuovi rilasci sono aggiunte, non interruzioni. Li confronti con ciò che stai già consegnando, non con ciò che stavi aspettando.

Cosa fare questa settimana

Omni Flash vive sulle superfici proprietarie di Google — l'app Gemini, YouTube Shorts, Google Flow. Se vuoi testare l'editing conversazionale, è lì che devi andare. Google non ha annunciato integrazioni API di terze parti al di là del calendario sviluppatori «nelle prossime settimane».

Su OmniArt, lavori oggi con Veo 3.1 per 4K nativo e audio spaziale, e il resto della lineup — modelli PixVerse, Sora 2, Kling, HappyHorse, Seedance 2 e altri — su immagini, video, audio e musica in un unico workspace. Un saldo, una grammatica di prompt, un posto dove confrontare gli output fianco a fianco.

Per i passi pratici su come sfruttare al massimo Veo 3.1 mentre valuti Omni Flash, la guida al prompt e alla cinematografia di Veo 3.1 copre l'intero flusso di lavoro dal briefing al clip finito.

La mossa concreta: esegui il tuo briefing attuale attraverso i modelli che sono live e stabili. Quando Omni Pro arriva — o quando l'API di Omni Flash si apre — lo aggiungi a un pipeline che sta già producendo, invece di aspettare per iniziare.

Domande frequenti

Gemini Omni Flash è disponibile adesso?

Sì. È stato lanciato al Google I/O 2026 il 19 maggio 2026 ed è diventato disponibile lo stesso giorno via YouTube Shorts, YouTube Create, l'app Gemini e Google Flow. Un'API per sviluppatori è descritta come in arrivo «nelle prossime settimane».

Qual è la differenza tra Omni Flash e Veo 3.1?

Omni Flash è nativo di Gemini, accetta input di qualsiasi tipo (testo, immagine, audio, video in un unico prompt) e ha l'editing conversazionale multi-turno. Veo 3.1 è un modello video dedicato con output 4K nativo confermato e audio spaziale. Hanno punti di forza diversi e attualmente vivono su superfici differenti.

Quali funzionalità ha trattenuto Google da Omni Flash?

Due capacità sono state deliberatamente trattenute: la modifica di voce e audio nel video, e la modalità avatar. Google ha confermato che sono state trattenute per ragioni di sicurezza, non per limitazioni tecniche. Non esiste una data di rilascio per nessuna delle due.

Gemini Omni Pro sostituirà Flash?

Google DeepMind ha confermato Omni Pro come futuro modello di livello superiore descritto come «un salto sopra Flash», ma nessuna funzionalità, prezzo o data di rilascio è stata divulgata. Pianifica sulla base delle capacità confermate di Flash; tratta Omni Pro come un'aggiunta futura.

Omni Flash ha un watermark SynthID?

Sì. Ogni output di Omni Flash include un watermark SynthID. Non è disattivabile e non ha un toggle API. Controlla i termini di servizio della piattaforma prima di utilizzare gli output in contesti commerciali.

Pronto a creare?

Inizia a generare contenuti straordinari con l’AI

Inizia gratis