DeepSeek V4 멀티모달: 크리에이터가 알아야 할 것
DeepSeek V4 멀티모달 — 100만 토큰 컨텍스트, V4-Flash·V4-Pro 가격, CSA+HCA 아키텍처, OmniArt 스택 안에서의 의미를 정리합니다.

DeepSeek V4는 2026년 4월 24일 두 티어, 100만 토큰 컨텍스트, 최대 384K 출력 길이와 함께 공개되었습니다. 비디오 모델이 아니며 그 자리를 대체하려는 모델도 아닙니다. V4가 바꾸는 것은 비주얼 스택 위 레이어입니다 — 브리프, 스토리보드, 브랜드 바이블, 올해 촬영 전체를 반영한 롱 컨텍스트 검색. 이 글은 DeepSeek V4가 무엇인지, OmniArt를 쓰는 크리에이터에게 무엇이 남는지, 로스터의 다른 모델과 어디에 맞는지 다룹니다.
DeepSeek V4란
DeepSeek V4는 V4-Flash와 V4-Pro 두 프로덕션 티어를 갖춘 장문 추론·도구 호출 모델이며, api.deepseek.com의 OpenAI 호환 API로 제공됩니다. 100만 토큰 컨텍스트와 구조화된 tool call이 헤드라인이고, 아래에는 CSA(압축 희소 어텐션)와 HCA(heavy compressed attention)가 있어 컨텍스트 길이에 비례해 비용이 선형으로 늘지 않게 합니다.
| 티어 | 총 파라미터 | 활성 파라미터 | 사전학습 토큰 | 출력 가격 | 입력(캐시 미스) |
|---|---|---|---|---|---|
| V4-Flash | 284B | 13B | 32T | ¥2 / 100만 (~$0.28) | ¥1 / 100만 |
| V4-Pro | 1.6T | 49B | 33T | ¥24 / 100만 (~$3.48) | ¥12 / 100만 |
두 티어 모두 출력 상한 384K 토큰. 같은 모델에서 「thinking」과 「non-thinking」 모드를 제공 — V3와 R1이 나누던 역할을 V4가 통합합니다.
아키텍처 한 단락
CSA는 레이어마다 소수의 고정보 토큰에만 어텐션을 좁히고, HCA가 그 위에 밀집 압축을 얹습니다. 이 조합이 100만 컨텍스트를 벤치마크 트로피가 아니라 실용 가격으로 만듭니다. DeepSeek은 CUDA 전용이 아닌 Huawei Ascend급 인프라에서 V4를 학습·서빙하며, Cambricon vLLM 적응이 추론 최적화를 담당합니다.
인용할 만한 벤치마크
| 벤치마크 | 결과 |
|---|---|
| Arena.ai 오픈소스 코드 아레나 | V4-Pro #3 |
| Arena.ai 종합 | V4-Pro #14 |
| Vals AI Vibe Code | 오픈웨이트 중 V4 #1 |
| Vibe Code vs V3.2 | 약 10배 성능 점프 |
| 폐쇄 모델 대비 | 일부 시나리오에서 Gemini 3.1 Pro 상회 |
DeepSeek 자체 메시지도 격차를 인정합니다: 복잡한 지식·추론에서는 「최상위 폐쇄 시스템보다 대략 3~6개월 뒤」. 대부분의 크리에이터 워크플로에는 그 격차가 병목이 아니지만, 존재는 알아 둘 가치가 있습니다.
V3, R1, V4 사이 변화
V3는 강한 텍스트·코드 모델, R1은 CoT 추론 모델이었습니다. V4는 thinking/non-thinking 경로를 한 모델에서 선택합니다. 컨텍스트는 128K(V3)에서 1M(V4)로. tool use와 장문 검색이 이제 일급 기능입니다.
| 기능 | V3 | R1 | V4 |
|---|---|---|---|
| 컨텍스트 | 128K | 128K | 1M |
| 추론 모드 | 없음 | 기본 on | 토글 |
| tool use | 제한 | 제한 | 일급 |
| 멀티모달 | 없음 | 없음 | 로드맵 진행 중 |
여기서 멀티모달의 의미 — 아직 아닌 것
DeepSeek V4 런치는 멀티모달 부분을 의도적으로 낮게 잡았습니다. API 수준의 이미지·비디오·오디오 엔드포인트는 아직 공개되지 않았습니다. 로드맵 신호로 읽는 것이 맞습니다. 오늘 V4의 크리에이터 가치는 비주얼 스택을 감싸는 장문 텍스트·도구 워크플로에 있지, 그 안에 있지 않습니다.
멀티모달 엔트리가 열리면 GPT Image 2 등과 같이 OmniArt 모델 피커에 들어옵니다. 그때까지 V4는 브리프를 돌리는 「두뇌」로 보세요.
오늘 V4로 하는 일 세 가지
OmniArt에서 지금 통하는 패턴입니다.
1. 브랜드 바이블을 100만 토큰 컨텍스트로
브랜드북, 캠페인 전체, 톤 가이드, 캐릭터 시트, 금지 표현, 12개월 포스트 카피를 한 번에 system context로 고정한 뒤 론치 브리프를 요청합니다. 임베딩 라운드트립 없이 전체 문서 세트를 반영합니다.
2. 장문 구조화 생성
출력 상한 384K 토큰 — 내러티브 바이블, 6편 스토리보드+샷 리스트, 50페이지 현지화 스펙을 한 패스로 초안 가능. 짧은 작업에는 V4-Flash(~$0.28/100만 출력)가 가장 저렴한 장문 구조 초안 수단입니다.
3. 비주얼 스택을 돌리는 tool-first 에이전트
OmniArt API 표면을 tool로 연결하고 브리프를 주면 모델·프롬프트·참조를 샷 단위로 제안합니다. OmniArt가 통합을 만들고 있는 패턴입니다.
V4-Flash vs V4-Pro
가격 비율은 대략 12배 — Flash는 대량 아이디에이션, Pro는 깊이가 토큰 비용보다 중요한 세션.
| 작업 | 선택 |
|---|---|
| 브레인스토밍, 초안, 헤드라인 반복 | V4-Flash |
| 브랜드 바이블 추론, 내러티브 구성 | V4-Pro |
| 캠페인 히스토리 장문 검색 | V4-Pro |
| 이미지/비디오를 돌리는 에이전트 루프 | 계획 V4-Pro, 실행 V4-Flash |
OmniArt 스택에서의 위치
V4는 OmniArt 이미지·비디오 모델을 대체하지 않습니다. 그 위 계획 레이어입니다.
| 레이어 | 역할 | 모델 |
|---|---|---|
| Plan | 브리프, 스토리보드, 샷 리스트, 브랜드 추론 | DeepSeek V4-Pro |
| Image | 스틸, 레퍼런스 프레임, 레이아웃 | Nano Banana Pro, GPT Image 2, Seedream 5.0 Lite |
| Video | 애니메이션 샷, 멀티샷 | V6 / BACH, Sora 2, Veo 3, Seedance 2.0, HappyHorse 1.0 |
| Iterate | 리스타일, 확장, 수정 | Grok Imagine, Runway Gen-4.5 |
Note
V4 멀티모달 엔트리는 DeepSeek 로드맵에 있으나 아직 OmniArt 피커에는 없습니다. 공개되는 날 크레딧·권장 프롬프트·스택 위치를 다시 안내하겠습니다.
앞으로 볼 신호
- 멀티모달 API 엔트리 — 공개 시 피커 논의 재개
- 증류 V4 변형 — V4 Lite 등 비용 구조 변화 가능
- 하드웨어 스토리 — Ascend급 추론은 CUDA 전용이 어려운 지역에서 중요
OmniArt에서 시작하기
DeepSeek V4는 아직 OmniArt 원클릭 피커에는 없고 API가 본거지입니다. 오늘 계획 레이어로 쓰려면 api.deepseek.com OpenAI 호환 엔드포인트에 연결하고 tool surface를 OmniArt API 이미지·비디오 생성에 맞추세요.
비주얼 스택 배경은 GPT Image 2 vs Nano Banana 2, 비디오 옵션은 2026 이미지-투-비디오 숏리스트를 참고하세요.