Filtración Gemini Omni: qué podría significar el modelo de vídeo de Google
Antes de Google I/O 2026, filtraciones apuntan a un modelo de vídeo Gemini Omni. Qué está confirmado, qué es rumor y qué hacer esta semana en OmniArt.

Google I/O 2026 es el 19–20 de mayo, y la esquina de vídeo IA ya vive el keynote por adelantado. La razón es una cadena de UI en la pestaña de vídeo de Gemini: «Empieza con una idea o prueba una plantilla. Powered by Omni.» De esa línea, tres oleadas de filtraciones dibujan un modelo de vídeo de Google aún no anunciado — provisionalmente Gemini Omni — que podría sustituir Veo 3.1, convivir con él o actualizar todo el stack generativo.
Este artículo es la lectura para creadores OmniArt que deciden si hacer algo antes del martes. Separamos señales confirmadas de especulación, recorremos tres identidades plausibles de Omni y cerramos con el movimiento práctico si debes entregar vídeo esta semana.
Qué sabemos (y qué no)
| Señal | Estado | Significado |
|---|---|---|
| Cadena UI «Powered by Omni» | Confirmada en capturas | Producto Omni preparado tras feature flag |
ID bard_eac_video_generation_omni | Reportado vía inspección | Identificador interno en el pipeline de vídeo |
| Límite 10 s | Testers tempranos | Restricción consumidor o etapa inicial |
| «Remix, edita en chat, plantillas» | Copy reportado | Flujos editar-remix, no solo generar |
| Texto coherente (p. ej. ecuaciones) | Demos reportadas | Avance en tipografía en vídeo |
| Audio nativo | No confirmado | Veo 3.1 sí; Omni incierto |
| API | No confirmada | No planificar sin confirmación |
| ¿Sustituye o complementa Veo 3.1? | Abierto | Pregunta clave para producción |
Resumen honesto: un producto Omni es lo bastante real para tener copy en UI; cada afirmación arquitectónica sigue siendo inferencia.
Tres identidades plausibles
Escenario 1 — Rebranding consumidor de Veo
Omni es la cara consumidor de «Veo» en Gemini, como «Nano Banana» en imagen. Veo sigue siendo motor; Omni es la superficie.
Si es cierto: pocos cambios vs Veo 3.1, mismos límites 8–10 s en consumidor, Veo en API/enterprise.
Escenario 2 — Modelo de vídeo nativo Gemini
Omni es Gemini afinado para vídeo en paralelo a Veo. Veo en API; Omni en consumidor con mejor adherencia y tipografía en chat.
Escenario 3 — Modelo omni-modal verdadero
Un solo sistema para texto, imagen, vídeo y audio. El nombre «Omni» apunta aquí aunque el lanzamiento sea parcial.
Lo más probable en I/O: mezcla de 2 y 3 — vídeo nativo Gemini con ambición omni-modal y límites consumidor al inicio.
Por qué importan las funciones reportadas
Edición conversacional por defecto
«Remix, edita en chat» cambia el flujo: de generar-descargar a colaborador continuo. Presiona al resto del campo a igualar.
Plantillas como rampa
Bajan la barrera de prompt; pueden homogeneizar salidas. La pregunta es si superan un brief bien escrito.
Texto dentro del vídeo
Ecuaciones legibles son técnicamente notables. Abre explicadores, educación y motion graphics sin paso de composición.
Dónde encajaría Omni
| Capacidad | Gemini Omni (reportado) | Veo 3.1 | V6 / R1 | Sora 2 |
|---|---|---|---|---|
| Duración | 10 s | Hasta 8 s | 1–15 s | Hasta 20 s |
| Resolución | Desconocida | Hasta 1080p | Hasta 1080p | 1080p, 4K |
| Audio nativo | No confirmado | Sí | Incluido | Incluido |
| Edición / remix | Reportado | Limitado | Modify, Extend | Limitado |
| API | No confirmada | Disponible | Disponible | Disponible |
| Fuerte en | Edición conversacional | 4K nativo, audio espacial | Control cinematográfico | Tomas largas |
Si el set filtrado se cumple, el carril de Omni es «vídeo consumidor conversacional» — social rápido e iteración en chat. Cine, broadcast y multi-shot siguen con sus líderes actuales.
Qué hacer esta semana
Warning
Trata cada función Omni en prensa como señal pre-anuncio, no capacidad confirmada. Los planes basados en specs reportadas sobreviven al keynote aproximadamente la mitad de las veces.
Si entregas vídeo esta semana
Usa lo live y probado: V6, Veo 3.1, Kling 3.0, HappyHorse 1.0 — en OmniArt a un clic, sin apostar por una sola herramienta.
Si planificas Q3
Brief por capacidades, no marcas. Tras I/O, el lineup re-licita el trabajo en dos semanas.
Si investigas
Mira el keynote. Guarda pruebas, no opiniones. Lo valioso post-lanzamiento es comparación manzanas a manzanas — mismo brief, referencias y rúbrica.
El cambio de categoría que señala Omni
La superficie competitiva se mueve hacia controlabilidad, consistencia multi-shot, sync audiovisual y edición conversacional.
El coste sigue siendo real — límites de uso y pestañas de consumo en la UI.
Derechos y remix se complican — IP y uso comercial antes de paid media.
Cómo lo manejará OmniArt
Añadimos modelos con disponibilidad estable y un trabajo creativo que el lineup no cubre. Si Omni llega y pasa, estará junto a Veo 3.1, Sora 2, V6, Kling 3.0, HappyHorse 1.0, Seedance 2.0, Runway, Hailuo y Grok Imagine.
Antecedentes: tour de modelos de vídeo OmniArt y guía de prompts.
FAQ
¿Gemini Omni está anunciado?
No. A 13 de mayo de 2026, Google no lo ha anunciado. I/O 19–20 de mayo es la ventana probable.
¿Sustituirá a Veo 3.1?
Incerto: rebranding, paralelo o sistema omni-modal unificado; lo más probable es mezcla 2+3 al lanzamiento.
¿Qué funciones se reportan?
Edición en chat, remix, plantillas, texto fuerte en vídeo, límite 10 s — sin confirmar oficialmente.
¿Esperar a Omni esta semana?
No. El lineup actual cubre cine, 4K broadcast, social multilingüe, iteración rápida y multi-shot. Si Omni cumple, se integra sin reescribir el pipeline.
¿Omni vs Veo 3.1?
Reportado: ventaja Omni en edición conversacional y tipografía; Veo 3.1 en audio nativo y 4K. Comparación directa cuando Omni sea público.