Gemini Omni Flash: o que foi lançado e o que o Google reteve
O Google lançou o Gemini Omni Flash no I/O 2026 — veja o que o primeiro modelo Omni faz, o que foi deliberadamente retido e qual a melhor estratégia para criadores na OmniArt.

O Google I/O 2026 aconteceu em 19 de maio, e quando o keynote terminou, o Gemini Omni Flash já estava no ar. Não "em breve", não "pré-visualização limitada" — disponível no mesmo dia. Duas semanas atrás, publicamos nossa análise dos vazamentos pré-I/O, separando os sinais confirmados da especulação. Agora temos o modelo de verdade. Aqui está o que foi lançado, o que o Google deliberadamente não lançou, e o que isso significa para criadores com prazos essa semana.
O Omni Flash é o primeiro modelo público do novo framework "Omni" do Google. Não é o Veo 4, e não é uma renomeação do Veo 3.1 — é uma linha de produto separada, com um Omni Pro de nível superior já confirmado pelo Google DeepMind como próximo passo. Sem data para o Omni Pro. Flash é a fase um.
O que foi confirmado vs. o que foi retido
O artigo sobre o vazamento descreveu o modelo como "vídeo nativo do Gemini com ambições omnimodais". Isso se confirmou bem. Aqui está o panorama completo agora que a poeira do keynote baixou.
| Recurso | Status | O que significa para criadores |
|---|---|---|
| Clipes de vídeo de 10 segundos com áudio sincronizado a partir de um único prompt | Lançado | Conteúdo para redes sociais, trailers e vinhetas de abertura são o uso natural para esse comprimento de clipe |
| Entrada de qualquer tipo: texto, imagem, áudio e vídeo em um único prompt | Lançado | Você pode combinar uma imagem de referência, um áudio de voz e um briefing — uma gramática de prompt para os três |
| Edição conversacional ("mude a iluminação", "troque o cachorro por um gato") | Lançado | A mudança de fluxo de trabalho que o artigo de vazamento apontou como o verdadeiro destaque — mais detalhes abaixo |
| Marca d'água SynthID em todos os outputs | Lançado — obrigatório, sem opção de desativar via API | Planeje ter outputs com marca d'água por padrão; verifique os termos de uso antes de aplicação comercial |
| Edição de fala ou áudio dentro do vídeo gerado | Retido por razões de segurança | Risco relacionado a deepfake; o Google confirmou que é uma retenção deliberada, não uma lacuna técnica |
| Modo avatar | Retido | Mesma categoria de preocupação que a edição de áudio — sem prazo divulgado |
| API para desenvolvedores | "Nas próximas semanas" | Não construa um pipeline de produção até que a API esteja no ar e estável |
Aviso
O Google também reconheceu publicamente três limitações atuais: consistência visual durante edições, sequências de movimento complexas e renderização de texto legível dentro do vídeo. Esses são os mesmos pontos fracos que toda a categoria de vídeo com IA compartilha; o Omni Flash não os resolveu.
Previsão do vazamento vs. realidade
Antes do I/O, descrevemos três cenários para o que o Omni poderia ser: uma reformulação de consumidor do Veo, um modelo de vídeo nativo do Gemini ou um sistema omnimodal unificado genuíno. Apontamos "uma combinação dos cenários 2 e 3" como o mais provável.
Isso foi preciso. O Omni Flash é inegavelmente nativo do Gemini — roda dentro do app Gemini e do Google Flow, não como uma superfície Veo independente — e é genuinamente de qualquer tipo de entrada para qualquer saída. O enquadramento "omnimodal" que o Google adotou não é exagero de marketing; combinar texto, imagem, áudio e vídeo em um único prompt é uma mudança real de capacidade em comparação ao modelo de entrada do Veo 3.1.
O que a especulação errou: o enquadramento de "remix" do vazamento subestimou a profundidade do recurso de edição conversacional. Não é apenas remixar do zero. Ele preserva consistência entre edições de múltiplos turnos, o que é algo materialmente diferente.
Edição conversacional é o verdadeiro destaque
Todos os principais modelos de vídeo com IA hoje funcionam da mesma forma no nível do fluxo de trabalho: você escreve um prompt, espera, baixa o clipe e faz um novo prompt se estiver errado. O Omni Flash quebra isso. O recurso de edição conversacional permite que você digite "mude a iluminação para a hora dourada" ou "troque o cachorro por um gato" e receba um clipe revisado que mantém consistência com os outputs anteriores, em vez de regenerar do zero.
Isso importa porque o custo da iteração em vídeo sempre foi o ciclo de regeneração — tanto em tempo quanto em créditos. A edição de múltiplos turnos que preserva consistência comprime a distância entre um primeiro rascunho e um clipe finalizado. Também significa que o modelo guarda estado sobre seu projeto de uma forma que fluxos de trabalho de gerar-e-descartar não conseguem.
As limitações atuais reconhecidas são reais: sequências de movimento complexas perdem coerência entre edições, e o modelo ainda pode derivar em detalhes visuais finos. Mas o princípio do fluxo de trabalho é sólido, e é o recurso com mais chance de envelhecer bem conforme o modelo subjacente melhora.
Onde o Omni Flash se encaixa na linha de produtos
Os pontos fortes do Omni Flash são acessibilidade para o consumidor, iteração conversacional e flexibilidade de entrada multimodal. Suas limitações — clipes de 10 segundos, sem edição de fala, lacunas reconhecidas de movimento e renderização de texto — definem claramente sua faixa de atuação.
| A cena exige | Use |
|---|---|
| Iteração conversacional, refinamento via chat | Omni Flash (nas superfícies do Google) |
| 4K nativo, áudio espacial, acabamento broadcast | Veo 3.1 |
| Tomadas únicas longas | Sora 2 |
| Continuidade de storyboard com múltiplos planos | Kling, V6 + BACH |
| Clipes rápidos, estilizados, de alta energia | Modelos PixVerse |
| Custo-benefício em volume | Kling (segundos finalizados de forma eficiente) |
Para uma análise mais aprofundada comparando Omni Flash e Veo 3.1 plano a plano, veja Gemini Omni Flash vs. Veo 3.1: qual é o certo para o seu fluxo de trabalho.
Onde acessar de verdade
O Omni Flash está disponível no YouTube Shorts, YouTube Create, app Gemini e Google Flow. A precificação passa pela camada de assinatura de IA do Google: o AI Plus começa em torno de $7,99/mês, e o Ultra caiu de $250 para $100/mês. Uma API para desenvolvedores chega "nas próximas semanas" — sem data exata.
Para contexto sobre a linha Veo em geral, status do lançamento do Veo 4 e onde o Veo se encaixa na OmniArt cobre o que o Veo 3.1 já faz e como ele se posiciona dentro de um workspace com múltiplos modelos.
Omni Pro está confirmado — mas sem data
O Google DeepMind confirmou que um Omni Pro de nível superior está a caminho, descrito como "um salto acima do Flash". Não há data de lançamento, lista de recursos ou acesso antecipado. Planeje com o que foi lançado, não com o que foi prometido.
Se seu pipeline tem uma entrega no Q3, construa-o com base nas especificações confirmadas do Omni Flash hoje. Quando o Omni Pro chegar, você o adiciona como opção dentro de um fluxo de trabalho que já está produzindo — você não espera por ele, e não refaz tudo por causa dele.
Nota
O que fazer essa semana
O Omni Flash vive nas próprias superfícies do Google — o app Gemini, YouTube Shorts, Google Flow. Se você quer testar a edição conversacional, é lá que deve ir. O Google não anunciou integrações com API de terceiros além do prazo "nas próximas semanas" para desenvolvedores.
Na OmniArt, você trabalha hoje com Veo 3.1 para 4K nativo e áudio espacial, e o restante da linha — modelos PixVerse, Sora 2, Kling, HappyHorse, Seedance 2 e mais — em imagem, vídeo, áudio e música em um único workspace. Um saldo, uma gramática de prompt, um lugar para comparar os outputs lado a lado.
Para os passos práticos sobre como aproveitar ao máximo o Veo 3.1 enquanto você avalia o Omni Flash, o guia de prompt e cinematografia do Veo 3.1 cobre o fluxo de trabalho completo do briefing ao clipe finalizado.
A estratégia prática: execute seu briefing atual pelos modelos que estão no ar e estáveis. Quando o Omni Pro chegar — ou quando a API do Omni Flash abrir — você o adiciona a um pipeline que já está produzindo, em vez de esperar para começar.
Perguntas frequentes
O Gemini Omni Flash já está disponível?
Sim. Ele foi lançado no Google I/O 2026 em 19 de maio de 2026 e entrou no ar no mesmo dia via YouTube Shorts, YouTube Create, app Gemini e Google Flow. Uma API para desenvolvedores é descrita como chegando "nas próximas semanas."
Qual é a diferença entre o Omni Flash e o Veo 3.1?
O Omni Flash é nativo do Gemini, aceita entradas de qualquer tipo (texto, imagem, áudio, vídeo em um único prompt) e tem edição conversacional de múltiplos turnos. O Veo 3.1 é um modelo de vídeo dedicado com saída nativa em 4K e áudio espacial confirmados. Eles têm pontos fortes diferentes e atualmente vivem em superfícies diferentes.
Quais recursos o Google reteve do Omni Flash?
Dois recursos foram deliberadamente retidos: edição de fala e áudio dentro do vídeo, e o modo avatar. O Google confirmou que foram retidos por razões de segurança, não por limitações técnicas. Não há data de lançamento para nenhum dos dois.
O Gemini Omni Pro vai substituir o Flash?
O Google DeepMind confirmou o Omni Pro como um modelo de nível superior futuro descrito como "um salto acima do Flash", mas nenhum recurso, precificação ou data de lançamento foram divulgados. Planeje com base nas capacidades confirmadas do Flash; trate o Omni Pro como uma adição futura.
O Omni Flash tem marca d'água SynthID?
Sim. Cada output do Omni Flash inclui uma marca d'água SynthID. Ela é obrigatória e não tem opção de desativar via API. Verifique os termos de serviço da plataforma antes de usar os outputs em contextos comerciais.
Pronto para criar?
Comece a gerar conteúdo incrível com IA