Seedance 2.0: паттерны промптов и шесть use case для AI video
Гайд креатора по Seedance 2.0 — мультиреференсы, нативное 2K, multi-shot таймлайны и шесть проверенных промптов с результатами в OmniArt.

Seedance 2.0 — модель, когда бриф читается как режиссёрский. ByteDance выпустила в феврале 2026 unified multimodal diffusion Transformer: текст, до девяти изображений, трёх референс-видео и трёх аудио в одном промпте — всё через @image1 и @video1. Самый чистый путь к character consistency в multi-shot таймлайнах сегодня. Гайд: грамматика промпта и шесть use case с промптами и результатами.
Что такое Seedance 2.0
Клипы 4–15 секунд до 2K со стерео-аудио. Заголовок — не разрешение, а multi-reference и timeline-style multi-shot prompting.
| Spec | Значение |
|---|---|
| Архитектура | Unified multimodal diffusion Transformer |
| Max resolution | 2K |
| Длительность | 4–15 с |
| Изображения | до 9 (@image1–@image9) |
| Видео | до 3 (@video1–@video3) |
| Аудио | до 3 (@audio1–@audio3) |
| Выходное аудио | Диалог, SFX, ambience, музыка |
| Lip-sync | 7+ языков |
| Режимы | Standard, Fast |
Зачем multi-reference
Большинство моделей — один референс или ноль. Seedance 2.0 — стек с ролями в промпте: @image1 лицо, @image2 костюм, @image3 локация, @video1 движение камеры, @audio1 music bed. Выход уважает каждую инструкцию, а не усредняет в шум.
Поэтому likeness держится между планами: тот же @image на каждом сегменте таймлайна — якорь identity, а не повторный вывод персонажа из текста.
Структура промпта
Шесть частей:
- Субъект
- Действие / движение
- Среда
- Визуальный стиль
- Камера
- Свет
Шаблон:
«Субъект (с
@image1при необходимости). Действие. Среда. Стиль. Камера (термин операторики). Свет.»
Нотация multi-shot таймлайна
0–4 с: wide establishing, персонаж (@image1) входит в сцену
4–8 с: medium tracking через комнату
8–12 с: 360° orbit вокруг стола
Один @image1 на все сегменты.
Дисциплина тегов
@image1,@image2— лицо, продукт.@video1— копируемое движение камеры.@audio1— когда bed важнее дефолта модели.- Явно назовите роль каждого тега в тексте.
Шесть use case с промптами
1. Кинематографическая сцена
«Пенсионер-детектив в длинном тёмном пальто идёт по мокрому переулку ночью. Неон отражается на брусчатке. Останавливается, закуривает, оглядывается. Slow push-in с wide на medium close-up. Film noir, anamorphic flare, teal-orange, film grain.»
Результат: плавный push-in, дождь, пальто, сигарета без искажения рук; ambient rain/city ~70 с.
2. Product commercial
«Флакон духов на чёрном мраморе, медленный 360° orbit, золотая жидкость, частицы пыли, macro, studio rim light, commercial photography.»
Результат: стекло и жидкость точны, ~65 с.
3. Music video
«Певица в красном шёлке на крыше на закате, skyline, ветер, emotional intensity, tracking orbit, golden hour, lens flare.»
Результат: физика платья, лицо стабильно в orbit, ambient track ~75 с.
4. Портрет в движении
«Японский мастер в мастерской, утренний свет через shoji, поднимает чашу для чая, close-up рук, tilt к лицу, wabi-sabi, documentary.»
Результат: пальцы, tilt, ambient workshop ~80 с.
5. Пейзаж
«Aerial над туманной долиной на рассвете, орлы, forward tracking с descent, epic landscape, golden hour.»
Результат: слои тумана, отражение реки, wind/birds ~55 с — самый быстрый из шести.
6. Аниме / fantasy
«Anime warrior princess на скале над горящим medieval city, silver hair, crimson cape, glowing katana, cherry blossoms, low-angle push-in, cel-shading.»
Результат: consistent cel-shading, sword swoosh audio ~70 с.
Типичные ошибки
| Проблема | Причина | Исправление |
|---|---|---|
| Reject | Face keywords | Убрать явные описания лица; @image |
| Чёрные кадры | Перегруз промпта | Одно действие на 4–5 с; ниже res для теста |
| Смена лица | Нет ref | Один @image1 на все планы |
| Рассинхрон аудио | Joint diffusion | Реген без аудио, bed отдельно |
| Руки | Сложная поза без ref | Ref позы рук |
| «AI texture» | Keyword spam | Материалы, свет, объектив |
Seedance 2.0 vs 1.0
| Feature | 1.0 | 2.0 |
|---|---|---|
| Архитектура | Separate pipelines | Unified DiT |
| Image | 1 optional | до 9 @tag |
| Video/audio in | Нет | 3 + 3 |
| Native audio out | Нет | Да |
| Max res | 1080p | 2K |
| Duration | 5–10 с | 4–15 с |
| Multi-shot | Basic | Timeline + cross-shot |
| Руки | Артефакты | Лучше |
| In-video edit | Нет | Swap character/object |
| First-attempt usable | ~60% | 90%+ |
Когда выбрать другое
| Потребность | Лучше |
|---|---|
| 4K 60fps broadcast | Veo 3 |
| Motion по кадрам | Runway Gen-4.5 |
| Дешёвый 720p соц с аудио | Grok Imagine |
| Самый быстрый loop | HappyHorse 1.0 |
| Параметрическая оптика | V6 |
| Длинный single take | Sora 2 |
Цены в OmniArt
Standard 720p — 30 кредитов/с; Fast 720p — 20. Ultra — скидка 40%. 5 с Standard 720p = 150 кредитов; Fast = 100.
Warning
ByteDance не опубликовала явные commercial rights на выход 2.0 на момент написания. Для high-stakes commercial — проверьте лицензию платформы.
С чего начать в OmniArt
Рядом с V6, BACH, Sora 2, Veo 3, Kling 3.0, HappyHorse 1.0, Grok Imagine. Начните с noir-сцены, затем music video для face consistency.
Сравнение: HappyHorse 1 vs Seedance 2. Длинный нарратив: BACH.