industryMô hình và insight4 phút đọc

DeepSeek V4 đa phương thức: creator cần biết gì

DeepSeek V4 — context 1M token, giá V4-Flash và V4-Pro, kiến trúc CSA + HCA, và ý nghĩa với creator trong stack OmniArt.

Đội ngũ OmniArt3 thg 5, 2026

DeepSeek V4 ra mắt 24/4/2026 với hai tier, context 1 triệu token và output tối đa 384K token. Đây không phải model video và không thay thế video. V4 thay đổi lớp trên stack thị giác — brief, storyboard, brand bible, retrieval context dài biến "làm campaign" thành "làm campaign tôn trọng mọi shoot năm nay." Bài này: V4 là gì, lợi ích cho creator OmniArt, vị trí cạnh roster model.

DeepSeek V4 là gì

Model suy luận context dài và tool-use với V4-Flash và V4-Pro qua API OpenAI-compatible tại api.deepseek.com. Headline: 1M context + tool call có cấu trúc; kiến trúc CSA + HCA giữ chi phí không scale tuyến tính theo độ dài context.

Tier	Tổng params	Active params	Giá output	Giá input (cache miss)
V4-Flash	284B	13B	¥2 / 1M token (~$0,28)	¥1 / 1M
V4-Pro	1,6T	49B	¥24 / 1M (~$3,48)	¥12 / 1M

Cả hai cap output 384K token; "thinking" và "non-thinking" từ cùng model — thống nhất V3 và R1.

Kiến trúc một đoạn

CSA thu hẹp attention vào token thông tin cao; HCA nén dense trên đó — 1M context khả thi về chi phí. Huấn luyện/phục vụ trên hạ tầng Huawei Ascend; Cambricon vLLM tối ưu inference.

Benchmark đáng trích

Benchmark	Kết quả
Arena.ai code open-source	V4-Pro #3
Arena.ai tổng thể	V4-Pro #14
Vals AI Vibe Code	V4 #1 open-weight
So V3.2	~10×
So closed top	Thắng Gemini 3.1 Pro một số kịch bản

DeepSeek thừa nhận vẫn kém closed top ~3–6 tháng ở reasoning phức tạp — hầu hết workflow creator không bị ràng.

V3, R1 và V4

V3 mạnh text/code. R1 chain-of-thought. V4 gộp hai mode; context 128K → 1M; tool use và retrieval dài là first-class.

Khả năng	V3	R1	V4
Context	128K	128K	1M
Reasoning	Không	Có (mặc định)	Bật/tắt
Tool use	Hạn chế	Hạn chế	First-class
Đa phương thức	Không	Không	Roadmap

"Đa phương thức" ở đây — và chưa ở đâu

Launch V4 cố ý không oversell multimodal — matrix tính năng "đang tiến hóa"; chưa có entry ảnh/video/audio ở API hôm nay. Giá trị hiện tại: text context dài + workflow tool bọc stack thị giác.

Khi entry multimodal có, sẽ vào picker OmniArt như GPT Image 2. Hiện coi V4 là não viết brief.

Creator dùng V4 hôm nay

1. Brand bible làm context 1M

Chứa sách thương hiệu, campaign đã publish, tone, character sheet, do-not-say, 12 tháng copy — pin system context, nhờ V4 draft launch brief tôn toàn bộ tài liệu.

2. Sinh dài có cấu trúc

384K output — bible narrative, storyboard 6 tập + shot list, spec localization 50 trang một pass. V4-Flash ~$0,28/1M output — rẻ để nháp dài.

3. Agent tool-first điều khiển stack thị giác

Tool discipline mạnh khi nối API ảnh/video OmniArt — đề xuất model, prompt, reference từng shot.

Chọn Flash hay Pro

Tỷ giá ~12× — Flash cho khối lượng, Pro khi chiều sâu quan trọng hơn token.

Job	Chọn
Brainstorm, headline	V4-Flash
Brand bible, narrative	V4-Pro
Retrieval lịch sử campaign	V4-Pro
Agent loop ảnh/video	Pro plan, Flash execute

V4 trong stack OmniArt

V4 không thay model ảnh/video — là lớp planning phía trên.

Lớp	Job	Model
Plan	Brief, storyboard, shot list	DeepSeek V4-Pro
Image	Still, reference	Nano Banana Pro, GPT Image 2, Seedream 5.0 Lite
Video	Shot động, multi-shot	V6/BACH, Sora 2, Veo 3, Seedance 2.0, HappyHorse 1.0
Iterate	Restyle, extend	Grok Imagine, Runway Gen-4.5

Ghi chú

Entry multimodal V4 trên roadmap DeepSeek, chưa trong picker OmniArt. Sẽ có bài follow-up ngày land — credits, prompt, vị trí stack.

Theo dõi 2 tháng tới

Entry API multimodal.
Biến thể distilled V4 Lite.
Câu chuyện hardware Ascend cho vùng khó CUDA-only.

Bắt đầu

V4 chưa one-click trong picker — dùng api.deepseek.com và trỏ tool call vào API OmniArt.

Đọc thêm GPT Image 2 vs Nano Banana 2 và ảnh sang video 2026.

Sẵn sàng sáng tạo?

Bắt đầu tạo nội dung tuyệt vời bằng AI

Bắt đầu miễn phí