industryМодели и аналитика8 мин чтения

Gemini Omni Flash: что вышло и что Google намеренно придержал

Google запустил Gemini Omni Flash на I/O 2026 — рассказываем, что умеет первая Omni-модель, какие функции были намеренно скрыты и какой практический шаг стоит сделать создателям на OmniArt.

Команда OmniArt
Gemini Omni Flash: что вышло и что Google намеренно придержал

Google I/O 2026 состоялся 19 мая, и Gemini Omni Flash стал доступен прямо в день окончания keynote. Не «скоро», не «ограниченный предпросмотр» — доступен в тот же день. Две недели назад мы опубликовали наш разбор предварительных утечек, отделив подтверждённые сигналы от домыслов. Теперь у нас есть реальная модель. Рассказываем, что вышло, что Google намеренно не выпустил и что это означает для создателей с дедлайнами на этой неделе.

Omni Flash — первая публичная модель в рамках нового фреймворка Google «Omni». Это не Veo 4 и не ребрендинг Veo 3.1 — это отдельная продуктовая линейка. Google DeepMind уже подтвердил выход более высокоуровневого Omni Pro в качестве следующего шага. Даты для Omni Pro нет. Flash — это первый этап.

Что подтверждено и что придержано

В статье об утечках модель описывалась как «нативное для Gemini видео с мультимодальными амбициями». Это подтвердилось. Вот полная картина после того, как пыль от keynote осела.

ФункцияСтатусЧто это означает для создателей
10-секундные видеоклипы с синхронным аудио из одного промптаВыпущеноТакая длина клипа идеально подходит для короткого формата в соцсетях, трейлеров и заставок
Любой тип входных данных: текст, изображение, аудио и видео в одном промптеВыпущеноМожно передать референсное изображение, голосовую заметку и бриф — одна грамматика промпта для всех трёх
Разговорное редактирование («измени освещение», «замени собаку на кошку»)ВыпущеноСдвиг в рабочем процессе, который статья об утечке называла главной новостью — подробнее ниже
Водяной знак SynthID в каждом результатеВыпущено — отключить нельзя, без переключателя в APIПланируйте, что по умолчанию результаты будут с водяным знаком; проверяйте условия использования перед коммерческим применением
Редактирование речи или аудио внутри сгенерированного видеоПридержано по соображениям безопасностиРиски, связанные с дипфейками; Google подтвердил, что это намеренное решение, а не техническое ограничение
Режим аватараПридержаноТа же категория опасений, что и редактирование аудио — сроков не объявлено
API для разработчиков«В ближайшие недели»Не стройте производственный пайплайн на нём, пока API не будет запущен и стабилен

Предупреждение

Две важные возможности — редактирование аудио внутри видео и режим аватара — были намеренно придержаны при запуске не по техническим, а по соображениям безопасности. Google это официально подтвердил. Если ваш пайплайн зависит от любой из них, обходного решения нет, и даты выхода тоже нет.

Google также публично признал три текущих ограничения: визуальная согласованность при редактировании, сложные последовательности движений и рендеринг читаемого текста внутри видео. Это те же слабые места, которые разделяет вся категория ИИ-видео; Omni Flash их не решил.

Предсказания по утечкам vs. реальность

Перед I/O мы описали три сценария того, чем мог стать Omni: потребительский ребрендинг Veo, нативная для Gemini видеомодель или настоящая единая мультимодальная система. Мы назвали «смесь сценариев 2 и 3» наиболее вероятной.

Это оказалось точным. Omni Flash явно нативен для Gemini — он работает внутри приложения Gemini и Google Flow, а не как отдельная Veo-поверхность — и действительно обрабатывает любые типы входных данных. Позиционирование «мультимодальный», которое дал ему Google, — не маркетинговое преувеличение; объединение текста, изображения, аудио и видео в одном промпте — это реальное изменение возможностей по сравнению с входной моделью Veo 3.1.

Где домыслы ошиблись: формулировка «ремикс» из утечки недооценивала глубину функции разговорного редактирования. Это не просто пересборка с нуля. Модель сохраняет согласованность в ходе многоходового редактирования — это принципиально другое.

Разговорное редактирование — настоящая главная новость

Все ведущие ИИ-видеомодели сегодня работают одинаково на уровне рабочего процесса: вы пишете промпт, ждёте, скачиваете клип и пишете повторный промпт, если результат неверен. Omni Flash разрывает этот цикл. Функция разговорного редактирования позволяет написать «измени освещение на золотой час» или «замени собаку на кошку» и получить исправленный клип, сохраняющий согласованность с предыдущими результатами, а не генерирующий всё заново.

Это важно, потому что стоимость итерации в видео всегда определялась циклом повторной генерации — как по времени, так и по кредитам. Многоходовое редактирование с сохранением согласованности сокращает расстояние между черновиком и готовым клипом. Это также означает, что модель хранит контекст о вашем проекте — чего не умеют рабочие процессы «сгенерировать и выбросить».

Текущие признанные ограничения реальны: сложные последовательности движений теряют согласованность при редактировании, и модель всё ещё может дрейфовать на тонких визуальных деталях. Но принцип рабочего процесса обоснован, и это функция, которая с наибольшей вероятностью хорошо состарится по мере улучшения базовой модели.

Место Omni Flash в линейке

Сильные стороны Omni Flash — доступность для потребителей, разговорная итерация и гибкость мультимодального ввода. Ограничения — 10-секундные клипы, отсутствие редактирования речи, признанные проблемы с движением и рендерингом текста — чётко определяют его нишу.

Для чего нужен материалИспользуйте
Разговорная итерация, уточнение через чатOmni Flash (на поверхностях Google)
Нативный 4K, пространственный звук, вещательное качествоVeo 3.1
Длинные одиночные дублиSora 2
Непрерывность сториборда из нескольких плановKling, V6 + BACH
Быстрые, стилизованные, энергичные клипыМодели PixVerse
Эффективность при больших объёмахKling (готовые секунды при минимальных затратах)

Для подробного сравнения Omni Flash и Veo 3.1 по кадрам смотрите Gemini Omni Flash vs. Veo 3.1: что выбрать для вашего рабочего процесса.

Где реально получить доступ

Omni Flash доступен на YouTube Shorts, YouTube Create, в приложении Gemini и Google Flow. Тарификация через уровень ИИ-подписки Google: AI Plus стартует от $7,99/месяц, Ultra снизился с $250 до $100/месяц. API для разработчиков появится «в ближайшие недели» — точной даты нет.

Об общем контексте линейки Veo читайте в материале статус выхода Veo 4 и место Veo в OmniArt — там рассказывается о возможностях Veo 3.1 и его роли в мультимодельном рабочем пространстве.

Omni Pro подтверждён — но без расписания

Google DeepMind подтвердил, что более высокоуровневый Omni Pro готовится к выходу — он описан как «шаг выше Flash». Нет ни даты выпуска, ни списка функций, ни предварительного доступа. Планируйте вокруг того, что выпущено, а не того, что обещано.

Если у вашего пайплайна есть поставка в Q3 — стройте его сегодня на подтверждённых характеристиках Omni Flash. Когда появится Omni Pro, вы добавите его как опцию в рабочий процесс, который уже производит результат, — а не будете ждать его или перестраивать платформу ради него.

Примечание

Именно в этом практическая ценность мультимодельного рабочего пространства: новые релизы — это дополнения, а не разрывы. Вы сравниваете их с тем, что уже поставляете, — а не с тем, чего ждали.

Что делать на этой неделе

Omni Flash работает на собственных поверхностях Google — в приложении Gemini, YouTube Shorts, Google Flow. Если хотите протестировать разговорное редактирование, идите туда. Google не объявил интеграций с API третьих сторон помимо «ближайших недель» для разработчиков.

На OmniArt вы работаете уже сегодня с Veo 3.1 для нативного 4K и пространственного звука и остальной линейкой — моделями PixVerse, Sora 2, Kling, HappyHorse, Seedance 2 и другими — для изображений, видео, аудио и музыки в одном рабочем пространстве. Один баланс, одна грамматика промптов, одно место для сравнения результатов рядом.

Для практических шагов по максимальному использованию Veo 3.1 пока вы оцениваете Omni Flash, руководство по промптам и кинематографии Veo 3.1 охватывает полный рабочий процесс от брифа до готового клипа.

Практический шаг: прогоните текущий бриф через модели, которые уже работают и стабильны. Когда появится Omni Pro — или откроется API Omni Flash — вы добавите его в пайплайн, который уже производит результат, а не будете ждать, чтобы начать.

Часто задаваемые вопросы

Gemini Omni Flash доступен прямо сейчас?

Да. Он был запущен на Google I/O 2026 19 мая 2026 года и стал доступен в тот же день через YouTube Shorts, YouTube Create, приложение Gemini и Google Flow. API для разработчиков описан как появляющийся «в ближайшие недели».

В чём разница между Omni Flash и Veo 3.1?

Omni Flash нативен для Gemini, принимает любые типы входных данных (текст, изображение, аудио, видео в одном промпте) и имеет разговорное многоходовое редактирование. Veo 3.1 — специализированная видеомодель с подтверждённым нативным выводом 4K и пространственным звуком. У них разные сильные стороны, и сейчас они работают на разных поверхностях.

Какие функции Google придержал в Omni Flash?

Две возможности были намеренно придержаны: редактирование речи и аудио внутри видео, а также режим аватара. Google подтвердил, что они придержаны по соображениям безопасности, а не из-за технических ограничений. Дат выхода нет ни для одной из них.

Заменит ли Gemini Omni Pro Flash?

Google DeepMind подтвердил Omni Pro как будущую более высокоуровневую модель, описанную как «шаг выше Flash», однако функции, цены и дата выхода не раскрывались. Планируйте на основе подтверждённых возможностей Flash; рассматривайте Omni Pro как будущее дополнение.

Есть ли в Omni Flash водяной знак SynthID?

Да. Каждый результат Omni Flash включает водяной знак SynthID. Отключить его нельзя, и переключателя в API нет. Проверьте условия использования платформы перед применением результатов в коммерческих контекстах.

Готовы создавать?

Начните генерировать впечатляющий контент с ИИ

Начать бесплатно