industryMô hình và insight4 min read
Journal · Mô hình và insight

DeepSeek V4 đa phương thức: creator cần biết gì

DeepSeek V4 — context 1M token, giá V4-Flash và V4-Pro, kiến trúc CSA + HCA, và ý nghĩa với creator trong stack OmniArt.

Đội ngũ OmniArt·
DeepSeek V4 đa phương thức: creator cần biết gì

DeepSeek V4 ra mắt 24/4/2026 với hai tier, context 1 triệu token và output tối đa 384K token. Đây không phải model video và không thay thế video. V4 thay đổi lớp trên stack thị giác — brief, storyboard, brand bible, retrieval context dài biến "làm campaign" thành "làm campaign tôn trọng mọi shoot năm nay." Bài này: V4 là gì, lợi ích cho creator OmniArt, vị trí cạnh roster model.

DeepSeek V4 là gì

Model suy luận context dài và tool-use với V4-Flash và V4-Pro qua API OpenAI-compatible tại api.deepseek.com. Headline: 1M context + tool call có cấu trúc; kiến trúc CSA + HCA giữ chi phí không scale tuyến tính theo độ dài context.

TierTổng paramsActive paramsGiá outputGiá input (cache miss)
V4-Flash284B13B¥2 / 1M token (~$0,28)¥1 / 1M
V4-Pro1,6T49B¥24 / 1M (~$3,48)¥12 / 1M

Cả hai cap output 384K token; "thinking" và "non-thinking" từ cùng model — thống nhất V3 và R1.

Kiến trúc một đoạn

CSA thu hẹp attention vào token thông tin cao; HCA nén dense trên đó — 1M context khả thi về chi phí. Huấn luyện/phục vụ trên hạ tầng Huawei Ascend; Cambricon vLLM tối ưu inference.

Benchmark đáng trích

BenchmarkKết quả
Arena.ai code open-sourceV4-Pro #3
Arena.ai tổng thểV4-Pro #14
Vals AI Vibe CodeV4 #1 open-weight
So V3.2~10×
So closed topThắng Gemini 3.1 Pro một số kịch bản

DeepSeek thừa nhận vẫn kém closed top ~3–6 tháng ở reasoning phức tạp — hầu hết workflow creator không bị ràng.

V3, R1 và V4

V3 mạnh text/code. R1 chain-of-thought. V4 gộp hai mode; context 128K → 1M; tool use và retrieval dài là first-class.

Khả năngV3R1V4
Context128K128K1M
ReasoningKhôngCó (mặc định)Bật/tắt
Tool useHạn chếHạn chếFirst-class
Đa phương thứcKhôngKhôngRoadmap

"Đa phương thức" ở đây — và chưa ở đâu

Launch V4 cố ý không oversell multimodal — matrix tính năng "đang tiến hóa"; chưa có entry ảnh/video/audio ở API hôm nay. Giá trị hiện tại: text context dài + workflow tool bọc stack thị giác.

Khi entry multimodal có, sẽ vào picker OmniArt như GPT Image 2. Hiện coi V4 là não viết brief.

Creator dùng V4 hôm nay

1. Brand bible làm context 1M

Chứa sách thương hiệu, campaign đã publish, tone, character sheet, do-not-say, 12 tháng copy — pin system context, nhờ V4 draft launch brief tôn toàn bộ tài liệu.

2. Sinh dài có cấu trúc

384K output — bible narrative, storyboard 6 tập + shot list, spec localization 50 trang một pass. V4-Flash ~$0,28/1M output — rẻ để nháp dài.

3. Agent tool-first điều khiển stack thị giác

Tool discipline mạnh khi nối API ảnh/video OmniArt — đề xuất model, prompt, reference từng shot.

Chọn Flash hay Pro

Tỷ giá ~12× — Flash cho khối lượng, Pro khi chiều sâu quan trọng hơn token.

JobChọn
Brainstorm, headlineV4-Flash
Brand bible, narrativeV4-Pro
Retrieval lịch sử campaignV4-Pro
Agent loop ảnh/videoPro plan, Flash execute

V4 trong stack OmniArt

V4 không thay model ảnh/video — là lớp planning phía trên.

LớpJobModel
PlanBrief, storyboard, shot listDeepSeek V4-Pro
ImageStill, referenceNano Banana Pro, GPT Image 2, Seedream 5.0 Lite
VideoShot động, multi-shotV6/BACH, Sora 2, Veo 3, Seedance 2.0, HappyHorse 1.0
IterateRestyle, extendGrok Imagine, Runway Gen-4.5

Note

Entry multimodal V4 trên roadmap DeepSeek, chưa trong picker OmniArt. Sẽ có bài follow-up ngày land — credits, prompt, vị trí stack.

Theo dõi 2 tháng tới

  • Entry API multimodal.
  • Biến thể distilled V4 Lite.
  • Câu chuyện hardware Ascend cho vùng khó CUDA-only.

Bắt đầu

V4 chưa one-click trong picker — dùng api.deepseek.com và trỏ tool call vào API OmniArt.

Đọc thêm GPT Image 2 vs Nano Banana 2ảnh sang video 2026.

Start creating

Sẵn sàng sáng tạo?

Bắt đầu tạo nội dung tuyệt vời bằng AI