guideРуководства и инструкции7 мин чтения

Как писать промпты для Gemini Omni Flash под 10-секундное видео

У Gemini Omni Flash необычный набор параметров: нет negative-поля, всего два соотношения сторон, только английский и два разных режима промптинга. Разбираем, как писать под оба.

Команда OmniArt
Как писать промпты для Gemini Omni Flash под 10-секундное видео

Большинство руководств по промптам для ИИ-видео учат одному: написать насыщенный, подробный абзац и один раз передать его модели. Gemini Omni Flash ломает это допущение. Её API для разработчиков (работает с 30 июня) построен вокруг двух разных действий с промптом — первой генерации, а затем непрерывного диалога из правок, каждая из которых заново формирует один и тот же клип. Если писать под одно и игнорировать другое, большая часть возможностей модели останется незадействованной.

Набор параметров Omni Flash необычен ещё и тем, чего в нём нет. Здесь нет поля для негативного промпта, нет регулятора температуры, нет системной инструкции и всего два соотношения сторон. Это не пробелы, которые нужно вслепую обходить, — каждый из них меняет то, как следует формулировать промпт. Это руководство охватывает оба режима и ограничения, которые их формируют.

Примечание

По состоянию на 1 июля 2026 года Gemini Omni Flash доступна через Google AI Studio, Gemini API, приложение Gemini и Google Flow — но пока не внутри рабочего пространства OmniArt. Разделы ниже описывают, как писать промпты напрямую в собственных инструментах Google; в завершающем разделе показано, какие приёмы переносятся на видеомодели, уже доступные в OmniArt сегодня.

Два режима промпта, а не один

В каждой сессии Omni Flash есть два вида промпта, и они вознаграждают разный подход к письму.

Промпт первой генерации — это полное задание на один 10-секундный кадр: субъект, движение, камера, свет, звук, стиль. Он ведёт себя как любой сильный промпт text-to-video или image-to-video: детали идут в начало, формулировки конкретны, весь кадр описывается сразу.

Инструкция диалоговой правки — противоположность. Она короткая, называет ровно одно изменение и исходит из того, что модель уже держит предыдущий клип в контексте. «Сделай освещение как в золотой час». «Замени седан на пикап». Модель применяет изменение, сохраняя всё, что вы не упомянули, — через previous_interaction_id, который переносит состояние сессии через до трёх последовательных правок с помощью Interactions API. Если втиснуть три изменения в одну инструкцию правки, теряется та точность, ради которой этот режим и стоит использовать.

Ментальная модель такая: компонуйте в первом промпте, режиссируйте в последующих. Получите крепкий базовый клип, а затем дорабатывайте его так, как давали бы указания режиссёру по ходу съёмки, — по одной заметке за раз.

Ограничения API, которые формируют ваши формулировки

Список параметров Omni Flash короток по замыслу. У каждого пропущенного параметра есть последствие для промпта:

ОграничениеЧто это значит для промпта
Нет поля негативного промптаФормулируйте исключения внутри самого промпта — «пустая улица, без пешеходов, без движения» вместо отдельного негативного списка
Нет temperature / top_p / системной инструкцииНельзя регулировать разброс или задать постоянное стилевое правило — закладывайте тон и стиль в текст промпта каждый раз
Соотношение сторон: только 9:16 или 16:9Выбирайте ориентацию заранее; варианта «квадрат» или «широкий кинокадр» нет, поэтому кадрируйте под вертикаль или горизонталь с первого слова
Звук описывается, но не загружаетсяНельзя передать модели дорожку для соответствия — вы описываете нужный звук словами (см. ниже)
Английский полностью поддержан; другие языки не протестированыПишите промпты на английском ради предсказуемого результата
Жёсткий предел 10 секундОдно чёткое действие на генерацию — не раскадровка

Предупреждение

У Omni Flash нет загрузки аудиореференса. Нельзя передать ей музыкальную подложку или образец голоса для синхронизации. Она по умолчанию генерирует звуковую дорожку, и ваш единственный рычаг управления — слова в промпте, поэтому саунд-дизайн приходится прописывать, а не прикреплять.

Шаблон для первой генерации

Поскольку 10 секунд вмещают один кадр, самые сильные первые промпты описывают один непрерывный момент со всеми проработанными слоями. Шесть слотов покрывают почти любой кадр:

  1. Субъект — кто или что в кадре, описанный конкретно
  2. Движение — единственное действие, разворачивающееся на протяжении клипа
  3. Камера — одно движение, а не последовательность («медленный наезд», «зафиксированный общий план»)
  4. Освещение — направление, качество, время суток
  5. Саунд-дизайн — звук, который нужно сгенерировать, словами
  6. Стиль — палитра, эпоха, киноотсылка, фактура

Проработанный пример:

«Керамическая воронка для пуровера на светлой дубовой столешнице, пар поднимается, пока тёмный кофе струится в стеклянный кувшин внизу. Медленный наезд на пролив. Мягкий утренний свет из окна слева от камеры, тёплый и рассеянный. Звук: лёгкое журчание воды, далёкая кухонная атмосфера, без музыки. Приглушённая редакторская палитра, малая глубина резкости, снято на светосильный фикс-объектив».

Обратите внимание: исключения живут внутри предложения («без музыки»), камера — одно движение, а звук расписан. В этом вся дисциплина.

Диалоговое редактирование: словарь, который срабатывает

Как только у вас есть базовый клип, именно правки — то, где Omni Flash вырывается вперёд по сравнению со схемой «сгенерировал и выбросил». Держите каждую инструкцию в рамках одного намерения и опирайтесь на последовательный словарь глаголов, который модель читает чисто:

  • Переосветить — «сделай золотой час», «добавь холодный контровой свет сзади»
  • Заменить — «замени воронку на френч-пресс»
  • Перестилизовать — «пусть выглядит как плёнка 1970-х»
  • Перекрасить — «сделай кружку матово-чёрной»
  • Перетаймировать — «замедли пролив», «пусть пар держится дольше»

Два правила удерживают нить связной. Одно изменение за ход — модель сохраняет то, что вы не упомянули, поэтому правка в одну заметку одновременно предсказуемее и легче откатывается повторным промптом. И опирайтесь на язык предыдущего хода — переиспользуйте существительные, которые вы задали («кружка», «пролив»), чтобы модель привязывалась к тем же элементам, а не выводила сцену заново.

Совет

Цепочка из трёх правок — это бюджет, а не рекомендация. Планируйте базовый промпт так, чтобы ему требовалось как можно меньше доработок: сильная первая генерация оставляет ходы правок для настоящих творческих изменений, а не для починки того, что первый промпт мог бы указать сразу.

Как обходить текущие ограничения

Часть ограничений не решается промптом, и лучше писать с оглядкой на них, а не бороться с ними:

  • Предел 10 секунд. В API нет продления сцены, поэтому не пишите промпты, подразумевающие более длинную арку. Проектируйте один кадр, который держится сам по себе.
  • Сохранение персонажа при смене сцен — признанное слабое место. Если важно сходство, держите правки в пределах одной сцены, а не просите модель переместить персонажа в новую обстановку.
  • Видеореференсы длиннее 3 секунд обрабатываются не полностью. Держите любой референсный клип коротким и по существу.
  • Нет мультивидеореференса и нет редактирования голоса — и то и другое не поддерживается, поэтому закладывайте эти шаги в отдельный инструмент, а не в промпт.

Ничто из этого не является дисквалифицирующим для быстрого инструмента коротких итераций. Это просто означает, что Omni Flash вознаграждает промпты, ограниченные тем, что она делает хорошо: один плотный кадр, доработанный в диалоге.

Что переносится в OmniArt сегодня

Omni Flash пока нет в рабочем пространстве OmniArt, но почти каждый приём выше переносится на видеомодели, которые там есть, — потому что лежащая в основе дисциплина (один чёткий кадр, конкретика вместо каши из ключевых слов, звук, прописанный в промпте) не зависит от модели.

  • Генерация на основе референсов напрямую отображается на Seedance 2.0, доступную в OmniArt, которая принимает до девяти изображений, трёх видео и трёх аудиофайлов, привязанных к ролям синтаксисом @image1 / @video1, — идея «собери из ассетов», но с бóльшим числом входов, чем предлагает Omni Flash.
  • Кинематографический язык камеры отображается на Veo 3.1, которая интерпретирует глаголы движения вроде «drift», «glide» и «dolly in» со сдержанностью.
  • Шаблон из шести слотов (субъект, движение, камера, свет, звук, стиль) — тот же каркас, что даёт чистый результат на каждой видеомодели в рабочем пространстве.

Откройте видео-пространство в OmniArt, выберите модель под кадр и напишите первый промпт как один цельный кадр. Когда появится Omni Flash, двухрежимный процесс выше — это та часть, которую вы добавите; ремесло промпта уже то же самое.

Готовы создавать?

Начните генерировать впечатляющий контент с ИИ

Начать бесплатно