DeepSeek V4 đa phương thức: creator cần biết gì
DeepSeek V4 — context 1M token, giá V4-Flash và V4-Pro, kiến trúc CSA + HCA, và ý nghĩa với creator trong stack OmniArt.

DeepSeek V4 ra mắt 24/4/2026 với hai tier, context 1 triệu token và output tối đa 384K token. Đây không phải model video và không thay thế video. V4 thay đổi lớp trên stack thị giác — brief, storyboard, brand bible, retrieval context dài biến "làm campaign" thành "làm campaign tôn trọng mọi shoot năm nay." Bài này: V4 là gì, lợi ích cho creator OmniArt, vị trí cạnh roster model.
DeepSeek V4 là gì
Model suy luận context dài và tool-use với V4-Flash và V4-Pro qua API OpenAI-compatible tại api.deepseek.com. Headline: 1M context + tool call có cấu trúc; kiến trúc CSA + HCA giữ chi phí không scale tuyến tính theo độ dài context.
| Tier | Tổng params | Active params | Giá output | Giá input (cache miss) |
|---|---|---|---|---|
| V4-Flash | 284B | 13B | ¥2 / 1M token (~$0,28) | ¥1 / 1M |
| V4-Pro | 1,6T | 49B | ¥24 / 1M (~$3,48) | ¥12 / 1M |
Cả hai cap output 384K token; "thinking" và "non-thinking" từ cùng model — thống nhất V3 và R1.
Kiến trúc một đoạn
CSA thu hẹp attention vào token thông tin cao; HCA nén dense trên đó — 1M context khả thi về chi phí. Huấn luyện/phục vụ trên hạ tầng Huawei Ascend; Cambricon vLLM tối ưu inference.
Benchmark đáng trích
| Benchmark | Kết quả |
|---|---|
| Arena.ai code open-source | V4-Pro #3 |
| Arena.ai tổng thể | V4-Pro #14 |
| Vals AI Vibe Code | V4 #1 open-weight |
| So V3.2 | ~10× |
| So closed top | Thắng Gemini 3.1 Pro một số kịch bản |
DeepSeek thừa nhận vẫn kém closed top ~3–6 tháng ở reasoning phức tạp — hầu hết workflow creator không bị ràng.
V3, R1 và V4
V3 mạnh text/code. R1 chain-of-thought. V4 gộp hai mode; context 128K → 1M; tool use và retrieval dài là first-class.
| Khả năng | V3 | R1 | V4 |
|---|---|---|---|
| Context | 128K | 128K | 1M |
| Reasoning | Không | Có (mặc định) | Bật/tắt |
| Tool use | Hạn chế | Hạn chế | First-class |
| Đa phương thức | Không | Không | Roadmap |
"Đa phương thức" ở đây — và chưa ở đâu
Launch V4 cố ý không oversell multimodal — matrix tính năng "đang tiến hóa"; chưa có entry ảnh/video/audio ở API hôm nay. Giá trị hiện tại: text context dài + workflow tool bọc stack thị giác.
Khi entry multimodal có, sẽ vào picker OmniArt như GPT Image 2. Hiện coi V4 là não viết brief.
Creator dùng V4 hôm nay
1. Brand bible làm context 1M
Chứa sách thương hiệu, campaign đã publish, tone, character sheet, do-not-say, 12 tháng copy — pin system context, nhờ V4 draft launch brief tôn toàn bộ tài liệu.
2. Sinh dài có cấu trúc
384K output — bible narrative, storyboard 6 tập + shot list, spec localization 50 trang một pass. V4-Flash ~$0,28/1M output — rẻ để nháp dài.
3. Agent tool-first điều khiển stack thị giác
Tool discipline mạnh khi nối API ảnh/video OmniArt — đề xuất model, prompt, reference từng shot.
Chọn Flash hay Pro
Tỷ giá ~12× — Flash cho khối lượng, Pro khi chiều sâu quan trọng hơn token.
| Job | Chọn |
|---|---|
| Brainstorm, headline | V4-Flash |
| Brand bible, narrative | V4-Pro |
| Retrieval lịch sử campaign | V4-Pro |
| Agent loop ảnh/video | Pro plan, Flash execute |
V4 trong stack OmniArt
V4 không thay model ảnh/video — là lớp planning phía trên.
| Lớp | Job | Model |
|---|---|---|
| Plan | Brief, storyboard, shot list | DeepSeek V4-Pro |
| Image | Still, reference | Nano Banana Pro, GPT Image 2, Seedream 5.0 Lite |
| Video | Shot động, multi-shot | V6/BACH, Sora 2, Veo 3, Seedance 2.0, HappyHorse 1.0 |
| Iterate | Restyle, extend | Grok Imagine, Runway Gen-4.5 |
Note
Entry multimodal V4 trên roadmap DeepSeek, chưa trong picker OmniArt. Sẽ có bài follow-up ngày land — credits, prompt, vị trí stack.
Theo dõi 2 tháng tới
- Entry API multimodal.
- Biến thể distilled V4 Lite.
- Câu chuyện hardware Ascend cho vùng khó CUDA-only.
Bắt đầu
V4 chưa one-click trong picker — dùng api.deepseek.com và trỏ tool call vào API OmniArt.
Đọc thêm GPT Image 2 vs Nano Banana 2 và ảnh sang video 2026.