DeepSeek V4 мультимодальный: что важно креаторам
DeepSeek V4 мультимодальный — контекст 1M токенов, цены V4-Flash и V4-Pro, архитектура CSA + HCA и место в стеке OmniArt для креаторов.

DeepSeek V4 вышел 24 апреля 2026 года с двумя tier, контекстом в 1 миллион токенов и максимальной длиной ответа 384K. Это не видеомодель и не претендует заменить её. V4 меняет слой над визуальным стеком — бриф, раскадровка, brand bible, long-context retrieval, который превращает «сделай кампанию» в «сделай кампанию с учётом всех съёмок этого года». Ниже — что такое DeepSeek V4, что он даёт креаторам OmniArt и как стыкуется с остальной линейкой.
Что такое DeepSeek V4
DeepSeek V4 — модель рассуждений и tool use с длинным контекстом: два production tier — V4-Flash и V4-Pro — через OpenAI-совместимый API на api.deepseek.com. Заголовок — 1M токенов и структурированные tool calls; под капотом compressed sparse attention (CSA) плюс heavy compressed attention (HCA), чтобы стоимость не росла линейно с длиной контекста.
| Tier | Всего параметров | Активных | Pre-training токенов | Цена output | Цена input (cache miss) |
|---|---|---|---|---|---|
| V4-Flash | 284B | 13B | 32T | ¥2 / 1M токенов (~$0.28) | ¥1 / 1M токенов |
| V4-Pro | 1.6T | 49B | 33T | ¥24 / 1M токенов (~$3.48) | ¥12 / 1M токенов |
Оба tier ограничивают output 384K токенами. Оба отдают режимы «thinking» и «non-thinking» из одной модели — V4 объединяет то, что V3 и R1 делали раздельно.
Архитектура в одном абзаце
Интересное — CSA + HCA. Compressed sparse attention сужает внимание к небольшому числу высокоинформативных токенов на слой; heavy compressed attention добавляет плотное сжатие сверху. Вместе 1M контекст остаётся доступным, а не только трофеем бенчмарка. DeepSeek обучает и обслуживает V4 на инфраструктуре класса Huawei Ascend, не только CUDA; адаптация vLLM от Cambricon оптимизирует inference.
Бенчмарки, которые стоит цитировать
| Бенчмарк | Результат |
|---|---|
| Arena.ai open-source code arena | V4-Pro #3 |
| Arena.ai overall | V4-Pro #14 |
| Vals AI Vibe Code Benchmark | V4 #1 среди open-weight |
| Vibe Code vs V3.2 | ~10× прирост |
| Сравнение с closed-моделями | Обходит Gemini 3.1 Pro в отдельных сценариях |
Сообщение DeepSeek честное: V4 «всё ещё отстаёт от самых топовых closed-систем примерно на три–шесть месяцев в сложном знании и рассуждении». Для большинства creator workflow это не узкое место — но знать стоит.
Что изменилось между V3, R1 и V4
V3 — сильная текстовая и кодовая модель. R1 — chain-of-thought. V4 объединяет оба режима с переключаемыми thinking / non-thinking путями. Контекст вырос с 128K (V3) до 1M (V4). Tool use и long-context retrieval — first-class, а не заплатки.
| Возможность | V3 | R1 | V4 |
|---|---|---|---|
| Контекст | 128K | 128K | 1M |
| Режим рассуждений | Нет | Да (по умолчанию) | Переключаемый |
| Tool use | Ограничен | Ограничен | First-class |
| Мультимодальность | Нет | Нет | Roadmap (в работе) |
Что здесь значит «мультимодальный» — и что пока нет
DeepSeek при запуске V4 намеренно не раздувал мультимодальную часть. В релизе матрица возможностей «продолжает развиваться» — публичных image, video и audio entry points на уровне API сегодня нет. Это не минус, а сигнал roadmap. Текущая ценность V4 для креаторов — long-context текст и tool-driven workflow вокруг визуального стека, не внутри него.
Когда появятся мультимодальные entry points, они попадут в picker OmniArt так же, как GPT Image 2 и остальные. Пока V4 — мозг, который ведёт бриф.
Что креаторы делают с V4 сегодня
Три паттерна окупаются в OmniArt прямо сейчас.
1. Brand bible как контекст на 1M токенов
1M контекст спокойно вмещает полный brand book, все опубликованные кампании, tone-of-voice, character sheet, do-not-say list и пост-копирайт за двенадцать месяцев. Закрепите всё как system context и попросите V4 набросать launch brief — вывод уважает весь набор документов без раунда embeddings.
2. Длинная структурированная генерация
Потолок output — 384K токенов. Хватает на narrative bible, шесть эпизодов с shot list или 50-страничную спецификацию локализации за один проход. Для коротких задач V4-Flash при ~$0.28 за 1M output tokens — самый дешёвый надёжный способ черновить длинный структурированный контент.
3. Tool-first агенты над визуальным стеком
Дисциплина tool calls V4 важна, когда вы подключаете генераторы изображений и видео. Передайте surface API OmniArt, дайте бриф — модель предложит модель, промпт и референсы по кадрам. Вокруг этого паттерна строится интеграция OmniArt.
V4-Flash или V4-Pro
Соотношение цен примерно 12× — Flash для объёма идей, Pro когда глубина важнее стоимости токена.
| Задача | Выбор |
|---|---|
| Мозговой штурм, черновики, заголовки | V4-Flash |
| Рассуждение по brand bible, нарратив | V4-Pro |
| Long-context по истории кампаний | V4-Pro |
| Agent loops image/video | V4-Pro для плана, V4-Flash для исполнения |
Место V4 в стеке OmniArt
V4 не заменяет image и video модели OmniArt. Это планирующий слой над ними. Складывающийся паттерн:
| Слой | Задача | Модель |
|---|---|---|
| План | Бриф, storyboard, shot list, brand reasoning | DeepSeek V4-Pro |
| Изображение | Stills, референсы, layout | Nano Banana Pro, GPT Image 2, Seedream 5.0 Lite |
| Видео | Анимация, multi-shot | V6 / BACH, Sora 2, Veo 3, Seedance 2.0, HappyHorse 1.0 |
| Итерация | Restyle, extend, modify | Grok Imagine, Runway Gen-4.5 |
Note
Мультимодальные entry points V4 в roadmap DeepSeek, но ещё не в picker OmniArt. Опубликуем follow-up в день появления — кредиты, рекомендуемые промпты и место в стеке.
На что смотреть в ближайшие два месяца
- Мультимодальные API entry points. Когда DeepSeek их опубликует, снова откроется разговор о picker.
- Дистиллированные варианты V4. Ранее упоминались V4 Lite и меньший вариант — могут изменить экономику tool-call агентов.
- История с железом. Inference на Huawei Ascend важен для регионов, где CUDA-only модели сложнее развернуть.
С чего начать в OmniArt
DeepSeek V4 пока не one-click модель в picker OmniArt — дом сейчас у API. Чтобы использовать V4 как планирующий слой над OmniArt, ведите через OpenAI-совместимый endpoint api.deepseek.com и направьте tool calls на API OmniArt для image и video.
Для визуальной стороны стека — сравнение GPT Image 2 и Nano Banana 2 и shortlist image-to-video 2026, которые V4 когда-нибудь будет вести.