industryModelos e insights5 min read
Journal · Modelos e insights

DeepSeek V4 multimodal: lo que los creadores deben saber

DeepSeek V4 multimodal — contexto de 1M tokens, precios V4-Flash y V4-Pro, arquitectura CSA + HCA y qué significa en el stack de OmniArt.

Equipo OmniArt·
DeepSeek V4 multimodal: lo que los creadores deben saber

DeepSeek V4 llegó el 24 de abril de 2026 con dos niveles, contexto de 1 millón de tokens y salida máxima de 384K. No es un modelo de vídeo ni pretende sustituir uno. Lo que V4 cambia es la capa sobre el stack visual — el brief, el storyboard, la biblia de marca, la recuperación de contexto largo que convierte «haz una campaña» en «haz una campaña que respete cada rodaje de este año». Este artículo cubre qué es DeepSeek V4, qué aporta a creadores en OmniArt y dónde encaja frente al resto del roster.

Qué es DeepSeek V4

DeepSeek V4 es un modelo de razonamiento de contexto largo y uso de herramientas con dos niveles de producción — V4-Flash y V4-Pro — ambos vía API compatible con OpenAI en api.deepseek.com. El titular es 1M de contexto más tool calls estructuradas; debajo, CSA (atención dispersa comprimida) más HCA (heavy compressed attention), lo que evita que el coste escale linealmente con la longitud.

NivelParams totalesActivosTokens pre-entrenoPrecio salidaEntrada (sin caché)
V4-Flash284B13B32T¥2 / 1M (~$0.28)¥1 / 1M
V4-Pro1.6T49B33T¥24 / 1M (~$3.48)¥12 / 1M

Ambos niveles limitan la salida a 384K tokens y ofrecen modos «thinking» y «non-thinking» en el mismo modelo — unifica lo que V3 y R1 separaban.

Arquitectura en un párrafo

CSA reduce la atención a pocos tokens de alta información por capa; HCA añade compresión densa encima. Esa combinación hace asequible el contexto de 1M. DeepSeek entrena y sirve V4 en infraestructura tipo Huawei Ascend, no solo CUDA, con optimización vLLM de Cambricon.

Benchmarks citables

BenchmarkResultado
Arena.ai código open sourceV4-Pro #3
Arena.ai globalV4-Pro #14
Vals AI Vibe CodeV4 #1 en open-weight
Vibe Code vs V3.2~10× salto
vs cerradosSupera Gemini 3.1 Pro en escenarios selectos

DeepSeek admite el hueco: V4 «sigue ~3–6 meses por detrás de los mejores cerrados en conocimiento y razonamiento complejo». En la mayoría de flujos de creadores no ata — pero conviene saberlo.

Cambios entre V3, R1 y V4

CapacidadV3R1V4
Contexto128K128K1M
Modo razonamientoNoSí (default)Conmutable
Tool useLimitadoLimitadoDe primera clase
MultimodalNoNoRoadmap en curso

Multimodal aquí — y lo que aún no es

El lanzamiento de V4 no vendió fuerte la pieza multimodal. No hay entradas API públicas de imagen, vídeo o audio hoy. El valor actual está en texto largo y flujos con herramientas que envuelven el stack visual. Cuando lleguen las entradas multimodales, entrarán en el selector OmniArt como GPT Image 2. Hasta entonces, V4 es el cerebro del brief.

Tres patrones que funcionan hoy en OmniArt

1. Biblias de marca como contexto de 1M

Caben libro de marca, campañas, tono, ficha de personaje, lista de no-decir y copy de 12 meses. Fíjalos como contexto de sistema y pide un brief de lanzamiento sin paso de embeddings.

2. Generación estructurada larga

Hasta 384K de salida — biblia narrativa, storyboard de seis episodios o spec de localización de 50 páginas en un pase. V4-Flash a ~$0.28 por 1M de salida es la forma barata de borradores largos estructurados.

3. Agentes tool-first que mueven el stack visual

La disciplina de tool call importa al cablear generadores de imagen y vídeo: brief → modelo, prompt y referencias por plano.

V4-Flash vs V4-Pro

Ratio de precio ~12× — Flash para ideación masiva, Pro cuando la profundidad importa más que el token.

TrabajoElige
Lluvia de ideas, titularesV4-Flash
Razonamiento de marca, narrativaV4-Pro
Historial de campaña largoV4-Pro
Bucles agente imagen/vídeoPro planifica, Flash ejecuta

V4 en el stack OmniArt

CapaTrabajoModelo
PlanBrief, storyboard, lista de planosDeepSeek V4-Pro
ImageStills, frames, layoutNano Banana Pro, GPT Image 2, Seedream 5.0 Lite
VideoPlanos animados, multi-shotV6 / BACH, Sora 2, Veo 3, Seedance 2.0, HappyHorse 1.0
IterateReestilo, extensiónGrok Imagine, Runway Gen-4.5

Note

Las entradas multimodales de V4 están en el roadmap de DeepSeek pero aún no en el selector OmniArt. Publicaremos seguimiento el día que aterricen.

Empezar en OmniArt

V4 aún no está en un clic en OmniArt — vive en la API. Para usarlo como capa de planificación, conecta api.deepseek.com y apunta las tools a la API OmniArt.

Lectura visual: GPT Image 2 vs Nano Banana 2 y mejores image-to-video 2026.

Start creating

¿Listo para crear?

Empieza a generar contenido increíble con IA