industryModelos e insights5 min de lectura

DeepSeek V4 multimodal: lo que los creadores deben saber

DeepSeek V4 multimodal — contexto de 1M tokens, precios V4-Flash y V4-Pro, arquitectura CSA + HCA y qué significa en el stack de OmniArt.

Equipo OmniArt3 may 2026

DeepSeek V4 llegó el 24 de abril de 2026 con dos niveles, contexto de 1 millón de tokens y salida máxima de 384K. No es un modelo de vídeo ni pretende sustituir uno. Lo que V4 cambia es la capa sobre el stack visual — el brief, el storyboard, la biblia de marca, la recuperación de contexto largo que convierte «haz una campaña» en «haz una campaña que respete cada rodaje de este año». Este artículo cubre qué es DeepSeek V4, qué aporta a creadores en OmniArt y dónde encaja frente al resto del roster.

Qué es DeepSeek V4

DeepSeek V4 es un modelo de razonamiento de contexto largo y uso de herramientas con dos niveles de producción — V4-Flash y V4-Pro — ambos vía API compatible con OpenAI en api.deepseek.com. El titular es 1M de contexto más tool calls estructuradas; debajo, CSA (atención dispersa comprimida) más HCA (heavy compressed attention), lo que evita que el coste escale linealmente con la longitud.

Nivel	Params totales	Activos	Tokens pre-entreno	Precio salida	Entrada (sin caché)
V4-Flash	284B	13B	32T	¥2 / 1M (~$0.28)	¥1 / 1M
V4-Pro	1.6T	49B	33T	¥24 / 1M (~$3.48)	¥12 / 1M

Ambos niveles limitan la salida a 384K tokens y ofrecen modos «thinking» y «non-thinking» en el mismo modelo — unifica lo que V3 y R1 separaban.

Arquitectura en un párrafo

CSA reduce la atención a pocos tokens de alta información por capa; HCA añade compresión densa encima. Esa combinación hace asequible el contexto de 1M. DeepSeek entrena y sirve V4 en infraestructura tipo Huawei Ascend, no solo CUDA, con optimización vLLM de Cambricon.

Benchmarks citables

Benchmark	Resultado
Arena.ai código open source	V4-Pro #3
Arena.ai global	V4-Pro #14
Vals AI Vibe Code	V4 #1 en open-weight
Vibe Code vs V3.2	~10× salto
vs cerrados	Supera Gemini 3.1 Pro en escenarios selectos

DeepSeek admite el hueco: V4 «sigue ~3–6 meses por detrás de los mejores cerrados en conocimiento y razonamiento complejo». En la mayoría de flujos de creadores no ata — pero conviene saberlo.

Cambios entre V3, R1 y V4

Capacidad	V3	R1	V4
Contexto	128K	128K	1M
Modo razonamiento	No	Sí (default)	Conmutable
Tool use	Limitado	Limitado	De primera clase
Multimodal	No	No	Roadmap en curso

Multimodal aquí — y lo que aún no es

El lanzamiento de V4 no vendió fuerte la pieza multimodal. No hay entradas API públicas de imagen, vídeo o audio hoy. El valor actual está en texto largo y flujos con herramientas que envuelven el stack visual. Cuando lleguen las entradas multimodales, entrarán en el selector OmniArt como GPT Image 2. Hasta entonces, V4 es el cerebro del brief.

Tres patrones que funcionan hoy en OmniArt

1. Biblias de marca como contexto de 1M

Caben libro de marca, campañas, tono, ficha de personaje, lista de no-decir y copy de 12 meses. Fíjalos como contexto de sistema y pide un brief de lanzamiento sin paso de embeddings.

2. Generación estructurada larga

Hasta 384K de salida — biblia narrativa, storyboard de seis episodios o spec de localización de 50 páginas en un pase. V4-Flash a ~$0.28 por 1M de salida es la forma barata de borradores largos estructurados.

3. Agentes tool-first que mueven el stack visual

La disciplina de tool call importa al cablear generadores de imagen y vídeo: brief → modelo, prompt y referencias por plano.

V4-Flash vs V4-Pro

Ratio de precio ~12× — Flash para ideación masiva, Pro cuando la profundidad importa más que el token.

Trabajo	Elige
Lluvia de ideas, titulares	V4-Flash
Razonamiento de marca, narrativa	V4-Pro
Historial de campaña largo	V4-Pro
Bucles agente imagen/vídeo	Pro planifica, Flash ejecuta

V4 en el stack OmniArt

Capa	Trabajo	Modelo
Plan	Brief, storyboard, lista de planos	DeepSeek V4-Pro
Image	Stills, frames, layout	Nano Banana Pro, GPT Image 2, Seedream 5.0 Lite
Video	Planos animados, multi-shot	V6 / BACH, Sora 2, Veo 3, Seedance 2.0, HappyHorse 1.0
Iterate	Reestilo, extensión	Grok Imagine, Runway Gen-4.5

Nota

Las entradas multimodales de V4 están en el roadmap de DeepSeek pero aún no en el selector OmniArt. Publicaremos seguimiento el día que aterricen.

Empezar en OmniArt

V4 aún no está en un clic en OmniArt — vive en la API. Para usarlo como capa de planificación, conecta api.deepseek.com y apunta las tools a la API OmniArt.

Lectura visual: GPT Image 2 vs Nano Banana 2 y mejores image-to-video 2026.

¿Listo para crear?

Empieza a generar contenido increíble con IA

Empezar gratis