industryModelos e insights10 min de lectura

Gemini Omni Flash: lo que se lanzó y lo que Google se reservó

Google presentó Gemini Omni Flash en el I/O 2026 — esto es lo que hace el primer modelo Omni, qué se retuvo deliberadamente y cuál es el movimiento práctico para los creadores en OmniArt.

Equipo OmniArt12 jun 2026

Nota

Actualización (13 de julio de 2026): Gemini Omni Flash ya está disponible en OmniArt para generación estándar de vídeo a partir de texto e imágenes de referencia. Los controles de edición conversacional con estado de Google todavía no están expuestos en la interfaz de OmniArt; las referencias antiguas de disponibilidad que aparecen abajo reflejan la fecha original de publicación.

Google I/O 2026 llegó el 19 de mayo y, antes de que terminara el keynote, Gemini Omni Flash ya estaba disponible. No "próximamente", no "vista previa limitada" — disponible el mismo día. Hace dos semanas publicamos nuestro análisis de las filtraciones previas al I/O, separando las señales confirmadas de la especulación. Ahora tenemos el modelo real. Aquí está lo que se lanzó, lo que Google deliberadamente no lanzó y qué significa para los creadores con entregas esta semana.

Omni Flash es el primer modelo público del nuevo framework "Omni" de Google. No es el Veo 4, y no es un cambio de nombre del Veo 3.1 — es una línea de producto separada, con un Omni Pro de nivel superior ya confirmado por Google DeepMind como continuación. Sin fecha para Omni Pro. Flash es la primera fase.

Lo que se confirmó vs. lo que se retuvo

El artículo sobre la filtración describió el modelo como "vídeo nativo de Gemini con ambiciones omnimodales". Eso se sostuvo bien. Aquí está el panorama completo ahora que se ha asentado el polvo del keynote.

Función	Estado	Qué significa para los creadores
Clips de vídeo de 10 segundos con audio sincronizado a partir de un único prompt	Lanzado	Las redes sociales de formato corto, los trailers y las cabeceras encajan perfectamente con esta duración
Entrada de cualquier tipo: texto, imagen, audio y vídeo en un único prompt	Lanzado	Puedes combinar una imagen de referencia, una nota de voz y un briefing — una gramática de prompt para los tres
Edición conversacional ("cambia la iluminación", "cambia el perro por un gato")	Lanzado	El cambio de flujo de trabajo que el artículo de filtración señaló como el verdadero titular — más detalles a continuación
Marca de agua SynthID en cada output	Lanzado — no se puede desactivar, sin opción en la API	Planifica tener outputs con marca de agua por defecto; revisa los términos de uso antes del uso comercial
Edición de voz o audio dentro del vídeo generado	Retenido por razones de seguridad	Riesgo relacionado con deepfakes; Google ha confirmado que es una retención deliberada, no una limitación técnica
Modo avatar	Retenido	Misma categoría de preocupación que la edición de audio — sin fecha de lanzamiento
API para desarrolladores	"En las próximas semanas"	No construyas un pipeline de producción hasta que la API esté disponible y estable

Advertencia

Dos funciones importantes — la edición de audio dentro del vídeo y el modo avatar — fueron deliberadamente retenidas en el lanzamiento, no por razones técnicas sino por seguridad. Google lo ha confirmado. Si tu pipeline depende de alguna de ellas, no hay solución alternativa ni fecha de lanzamiento.

Google también ha reconocido públicamente tres limitaciones actuales: la consistencia visual durante las ediciones, las secuencias de movimiento complejas y la representación de texto legible dentro del vídeo. Estos son los mismos puntos débiles que comparte toda la categoría de vídeo con IA; Omni Flash no los ha resuelto.

La filtración vs. la realidad

Antes del I/O describimos tres escenarios posibles para lo que Omni podría ser: una reorientación de consumidor del Veo, un modelo de vídeo nativo de Gemini o un sistema omnimodal unificado real. Señalamos que "una combinación de los escenarios 2 y 3" era lo más probable.

Eso fue acertado. Omni Flash es inconfundiblemente nativo de Gemini — se ejecuta dentro de la app de Gemini y de Google Flow, no como una superficie independiente de Veo — y genuinamente acepta cualquier tipo de entrada. El encuadre "omnimodal" que le ha dado Google no es exageración de marketing; combinar texto, imagen, audio y vídeo en un único prompt es un cambio real de capacidad respecto al modelo de entrada de Veo 3.1.

Lo que la especulación no acertó: el encuadre de "remix" de la filtración subestimó la profundidad del recurso de edición conversacional. No es solo remezclar desde cero. Preserva la consistencia a lo largo de ediciones de múltiples turnos, lo que es algo materialmente diferente.

La edición conversacional es el verdadero titular

Todos los principales modelos de vídeo con IA funcionan hoy de la misma manera a nivel de flujo de trabajo: escribes un prompt, esperas, descargas el clip y vuelves a escribir un prompt si no está bien. Omni Flash rompe con esto. El recurso de edición conversacional te permite escribir "cambia la iluminación a la hora dorada" o "cambia el perro por un gato" y obtener un clip revisado que mantiene coherencia con los outputs anteriores en lugar de regenerarse desde cero.

Esto importa porque el coste de la iteración en vídeo siempre ha sido el ciclo de regeneración — tanto en tiempo como en créditos. La edición de múltiples turnos que preserva la consistencia comprime la distancia entre un primer borrador y un clip terminado. También significa que el modelo mantiene un estado sobre tu proyecto de una forma que los flujos de trabajo de generar y descartar no tienen.

Las limitaciones actuales reconocidas son reales: las secuencias de movimiento complejas pierden coherencia entre ediciones, y el modelo todavía puede desviarse en los detalles visuales finos. Pero el principio del flujo de trabajo es sólido, y es el recurso con más probabilidades de aguantar bien a medida que el modelo subyacente mejore.

Dónde encaja Omni Flash en la línea de productos

Los puntos fuertes de Omni Flash son la accesibilidad para el consumidor, la iteración conversacional y la flexibilidad de entrada multimodal. Sus limitaciones — clips de 10 segundos, sin edición de voz, carencias reconocidas en movimiento y texto — definen claramente su nicho.

La toma necesita	Usa
Iteración conversacional, refinado mediante chat	Omni Flash (en las superficies de Google)
4K nativo, audio espacial, acabado de difusión	Veo 3.1
Tomas únicas largas	Sora 2
Continuidad de storyboard multitoma	Kling, V6 + BACH
Clips rápidos, estilizados y de alta energía	Modelos PixVerse
Valor a gran volumen	Kling (segundos finales con coste eficiente)

Para un análisis más detallado comparando Omni Flash y Veo 3.1 plano a plano, consulta Gemini Omni Flash vs. Veo 3.1: cuál es el adecuado para tu flujo de trabajo.

Dónde acceder realmente

Omni Flash está disponible en YouTube Shorts, YouTube Create, la app de Gemini y Google Flow. El precio se gestiona a través del nivel de suscripción de IA de Google: AI Plus parte de unos $7,99/mes, y Ultra bajó de $250 a $100/mes. Una API para desarrolladores llegará "en las próximas semanas" — sin fecha exacta.

Para contexto sobre la línea Veo en general, estado del lanzamiento de Veo 4 y dónde encaja Veo en OmniArt cubre lo que ya hace Veo 3.1 y cómo se sitúa dentro de un workspace con múltiples modelos.

Omni Pro está confirmado — pero sin fecha

Google DeepMind ha confirmado que un Omni Pro de nivel superior está en camino, descrito como "un paso por encima de Flash". No hay fecha de lanzamiento, lista de funciones ni acceso anticipado. Planifica en torno a lo que se ha lanzado, no a lo que se ha prometido.

Si tu pipeline tiene una entrega en el Q3, construyelo hoy en base a las especificaciones confirmadas de Omni Flash. Cuando llegue Omni Pro, lo añades como opción dentro de un flujo de trabajo que ya está produciendo — no lo esperas, ni refactorizas tu plataforma por él.

Nota

Este es el argumento para un workspace con múltiples modelos en la práctica: los nuevos lanzamentos son adiciones, no disrupciones. Los comparas con lo que ya estás entregando, no con lo que estabas esperando.

Qué hacer esta semana

Omni Flash vive en las propias superficies de Google — la app de Gemini, YouTube Shorts, Google Flow. Si quieres probar la edición conversacional, ahí es donde debes hacerlo. Google no ha anunciado integraciones con API de terceros más allá del calendario "en las próximas semanas" para desarrolladores.

En OmniArt, trabajas hoy con Veo 3.1 para 4K nativo y audio espacial, y el resto de la línea — modelos PixVerse, Sora 2, Kling, HappyHorse, Seedance 2 y más — en imagen, vídeo, audio y música en un único workspace. Un saldo, una gramática de prompt, un lugar para comparar los outputs en paralelo.

Para los pasos prácticos sobre cómo sacar el máximo partido a Veo 3.1 mientras evalúas Omni Flash, la guía de prompt y cinematografía de Veo 3.1 cubre el flujo de trabajo completo desde el briefing hasta el clip terminado.

El movimiento práctico: ejecuta tu briefing actual en los modelos que están disponibles y son estables. Cuando llegue Omni Pro — o cuando se abra la API de Omni Flash — lo añades a un pipeline que ya está produciendo, en lugar de esperar para empezar.

Preguntas frecuentes

¿Gemini Omni Flash ya está disponible?

Sí. Se lanzó en Google I/O 2026 el 19 de mayo de 2026 y quedó disponible el mismo día a través de YouTube Shorts, YouTube Create, la app de Gemini y Google Flow. Una API para desarrolladores está descrita como llegando "en las próximas semanas".

¿Cuál es la diferencia entre Omni Flash y Veo 3.1?

Omni Flash es nativo de Gemini, acepta entradas de cualquier tipo (texto, imagen, audio, vídeo en un único prompt) y tiene edición conversacional de múltiples turnos. Veo 3.1 es un modelo de vídeo dedicado con salida nativa en 4K y audio espacial confirmados. Tienen puntos fuertes diferentes y actualmente viven en superficies distintas.

¿Qué funciones retuvo Google de Omni Flash?

Dos funcionalidades fueron retenidas deliberadamente: la edición de voz y audio dentro del vídeo, y el modo avatar. Google ha confirmado que se retuvieron por razones de seguridad, no por limitaciones técnicas. No hay fecha de lanzamiento para ninguna de las dos.

¿Gemini Omni Pro reemplazará a Flash?

Google DeepMind ha confirmado Omni Pro como un futuro modelo de nivel superior descrito como "un paso por encima de Flash", pero no se han revelado funciones, precios ni fecha de lanzamiento. Planifica en base a las capacidades confirmadas de Flash; trata Omni Pro como una adición futura.

¿Omni Flash tiene marca de agua SynthID?

Sí. Cada output de Omni Flash incluye una marca de agua SynthID. No se puede desactivar y no tiene opción en la API. Revisa los términos de servicio de la plataforma antes de usar los outputs en contextos comerciales.

¿Listo para crear?

Empieza a generar contenido increíble con IA

Empezar gratis