Как писать промпты для Gemini Omni Flash под 10-секундное видео
У Gemini Omni Flash необычный набор параметров: нет negative-поля, всего два соотношения сторон, только английский и два разных режима промптинга. Разбираем, как писать под оба.

Большинство руководств по промптам для ИИ-видео учат одному: написать насыщенный, подробный абзац и один раз передать его модели. Gemini Omni Flash ломает это допущение. Её API для разработчиков (работает с 30 июня) построен вокруг двух разных действий с промптом — первой генерации, а затем непрерывного диалога из правок, каждая из которых заново формирует один и тот же клип. Если писать под одно и игнорировать другое, большая часть возможностей модели останется незадействованной.
Набор параметров Omni Flash необычен ещё и тем, чего в нём нет. Здесь нет поля для негативного промпта, нет регулятора температуры, нет системной инструкции и всего два соотношения сторон. Это не пробелы, которые нужно вслепую обходить, — каждый из них меняет то, как следует формулировать промпт. Это руководство охватывает оба режима и ограничения, которые их формируют.
Примечание
По состоянию на 1 июля 2026 года Gemini Omni Flash доступна через Google AI Studio, Gemini API, приложение Gemini и Google Flow — но пока не внутри рабочего пространства OmniArt. Разделы ниже описывают, как писать промпты напрямую в собственных инструментах Google; в завершающем разделе показано, какие приёмы переносятся на видеомодели, уже доступные в OmniArt сегодня.
Два режима промпта, а не один
В каждой сессии Omni Flash есть два вида промпта, и они вознаграждают разный подход к письму.
Промпт первой генерации — это полное задание на один 10-секундный кадр: субъект, движение, камера, свет, звук, стиль. Он ведёт себя как любой сильный промпт text-to-video или image-to-video: детали идут в начало, формулировки конкретны, весь кадр описывается сразу.
Инструкция диалоговой правки — противоположность. Она короткая, называет ровно одно изменение и исходит из того, что модель уже держит предыдущий клип в контексте. «Сделай освещение как в золотой час». «Замени седан на пикап». Модель применяет изменение, сохраняя всё, что вы не упомянули, — через previous_interaction_id, который переносит состояние сессии через до трёх последовательных правок с помощью Interactions API. Если втиснуть три изменения в одну инструкцию правки, теряется та точность, ради которой этот режим и стоит использовать.
Ментальная модель такая: компонуйте в первом промпте, режиссируйте в последующих. Получите крепкий базовый клип, а затем дорабатывайте его так, как давали бы указания режиссёру по ходу съёмки, — по одной заметке за раз.
Ограничения API, которые формируют ваши формулировки
Список параметров Omni Flash короток по замыслу. У каждого пропущенного параметра есть последствие для промпта:
| Ограничение | Что это значит для промпта |
|---|---|
| Нет поля негативного промпта | Формулируйте исключения внутри самого промпта — «пустая улица, без пешеходов, без движения» вместо отдельного негативного списка |
| Нет temperature / top_p / системной инструкции | Нельзя регулировать разброс или задать постоянное стилевое правило — закладывайте тон и стиль в текст промпта каждый раз |
| Соотношение сторон: только 9:16 или 16:9 | Выбирайте ориентацию заранее; варианта «квадрат» или «широкий кинокадр» нет, поэтому кадрируйте под вертикаль или горизонталь с первого слова |
| Звук описывается, но не загружается | Нельзя передать модели дорожку для соответствия — вы описываете нужный звук словами (см. ниже) |
| Английский полностью поддержан; другие языки не протестированы | Пишите промпты на английском ради предсказуемого результата |
| Жёсткий предел 10 секунд | Одно чёткое действие на генерацию — не раскадровка |
Предупреждение
У Omni Flash нет загрузки аудиореференса. Нельзя передать ей музыкальную подложку или образец голоса для синхронизации. Она по умолчанию генерирует звуковую дорожку, и ваш единственный рычаг управления — слова в промпте, поэтому саунд-дизайн приходится прописывать, а не прикреплять.
Шаблон для первой генерации
Поскольку 10 секунд вмещают один кадр, самые сильные первые промпты описывают один непрерывный момент со всеми проработанными слоями. Шесть слотов покрывают почти любой кадр:
- Субъект — кто или что в кадре, описанный конкретно
- Движение — единственное действие, разворачивающееся на протяжении клипа
- Камера — одно движение, а не последовательность («медленный наезд», «зафиксированный общий план»)
- Освещение — направление, качество, время суток
- Саунд-дизайн — звук, который нужно сгенерировать, словами
- Стиль — палитра, эпоха, киноотсылка, фактура
Проработанный пример:
«Керамическая воронка для пуровера на светлой дубовой столешнице, пар поднимается, пока тёмный кофе струится в стеклянный кувшин внизу. Медленный наезд на пролив. Мягкий утренний свет из окна слева от камеры, тёплый и рассеянный. Звук: лёгкое журчание воды, далёкая кухонная атмосфера, без музыки. Приглушённая редакторская палитра, малая глубина резкости, снято на светосильный фикс-объектив».
Обратите внимание: исключения живут внутри предложения («без музыки»), камера — одно движение, а звук расписан. В этом вся дисциплина.
Диалоговое редактирование: словарь, который срабатывает
Как только у вас есть базовый клип, именно правки — то, где Omni Flash вырывается вперёд по сравнению со схемой «сгенерировал и выбросил». Держите каждую инструкцию в рамках одного намерения и опирайтесь на последовательный словарь глаголов, который модель читает чисто:
- Переосветить — «сделай золотой час», «добавь холодный контровой свет сзади»
- Заменить — «замени воронку на френч-пресс»
- Перестилизовать — «пусть выглядит как плёнка 1970-х»
- Перекрасить — «сделай кружку матово-чёрной»
- Перетаймировать — «замедли пролив», «пусть пар держится дольше»
Два правила удерживают нить связной. Одно изменение за ход — модель сохраняет то, что вы не упомянули, поэтому правка в одну заметку одновременно предсказуемее и легче откатывается повторным промптом. И опирайтесь на язык предыдущего хода — переиспользуйте существительные, которые вы задали («кружка», «пролив»), чтобы модель привязывалась к тем же элементам, а не выводила сцену заново.
Совет
Цепочка из трёх правок — это бюджет, а не рекомендация. Планируйте базовый промпт так, чтобы ему требовалось как можно меньше доработок: сильная первая генерация оставляет ходы правок для настоящих творческих изменений, а не для починки того, что первый промпт мог бы указать сразу.
Как обходить текущие ограничения
Часть ограничений не решается промптом, и лучше писать с оглядкой на них, а не бороться с ними:
- Предел 10 секунд. В API нет продления сцены, поэтому не пишите промпты, подразумевающие более длинную арку. Проектируйте один кадр, который держится сам по себе.
- Сохранение персонажа при смене сцен — признанное слабое место. Если важно сходство, держите правки в пределах одной сцены, а не просите модель переместить персонажа в новую обстановку.
- Видеореференсы длиннее 3 секунд обрабатываются не полностью. Держите любой референсный клип коротким и по существу.
- Нет мультивидеореференса и нет редактирования голоса — и то и другое не поддерживается, поэтому закладывайте эти шаги в отдельный инструмент, а не в промпт.
Ничто из этого не является дисквалифицирующим для быстрого инструмента коротких итераций. Это просто означает, что Omni Flash вознаграждает промпты, ограниченные тем, что она делает хорошо: один плотный кадр, доработанный в диалоге.
Что переносится в OmniArt сегодня
Omni Flash пока нет в рабочем пространстве OmniArt, но почти каждый приём выше переносится на видеомодели, которые там есть, — потому что лежащая в основе дисциплина (один чёткий кадр, конкретика вместо каши из ключевых слов, звук, прописанный в промпте) не зависит от модели.
- Генерация на основе референсов напрямую отображается на Seedance 2.0, доступную в OmniArt, которая принимает до девяти изображений, трёх видео и трёх аудиофайлов, привязанных к ролям синтаксисом
@image1/@video1, — идея «собери из ассетов», но с бóльшим числом входов, чем предлагает Omni Flash. - Кинематографический язык камеры отображается на Veo 3.1, которая интерпретирует глаголы движения вроде «drift», «glide» и «dolly in» со сдержанностью.
- Шаблон из шести слотов (субъект, движение, камера, свет, звук, стиль) — тот же каркас, что даёт чистый результат на каждой видеомодели в рабочем пространстве.
Откройте видео-пространство в OmniArt, выберите модель под кадр и напишите первый промпт как один цельный кадр. Когда появится Omni Flash, двухрежимный процесс выше — это та часть, которую вы добавите; ремесло промпта уже то же самое.
Готовы создавать?
Начните генерировать впечатляющий контент с ИИ