
DeepSeek regresa con su innovadora familia de modelos de Inteligencia Artificial, DeepSeek-V4, enfocada en la alta eficiencia para el manejo de contextos extensos. Este nuevo avance posiciona a la empresa china en una competencia directa no solo contra gigantes como OpenAI, Google y Anthropic, sino también contra otras potentes IA de código abierto.
La compañía ha revelado detalles de DeepSeek-V4 a través de un documento publicado en Hugging Face. La familia está compuesta por dos modelos basados en la arquitectura Mixture-of-Experts (MoE):
- DeepSeek-V4-Pro: Posee un total de 1.6 billones de parámetros, activando 49 mil millones por inferencia.
- DeepSeek-V4-Flash: Trabaja con 284 mil millones de parámetros, activando 13 mil millones en cada consulta.
Según pruebas internas, DeepSeek-V4-Pro destaca como el modelo de código abierto líder en varios aspectos. En conocimiento general, supera a sus predecesores en SimpleQA-Verified. En programación competitiva, su desempeño en Codeforces lo sitúa entre los mejores, igualando a GPT-5.4 en esta área, un hito para modelos abiertos.

Comparado con modelos como Gemini 3.1-Pro y Claude Opus 4.6, DeepSeek-V4-Pro-Max, aunque todavía ligeramente por detrás en algunas pruebas de conocimiento y razonamiento general, aventaja a Gemini-3.1 Pro en la recuperación de información con contextos largos. En tareas de agente, se alinea con otros modelos abiertos, sin superar aún a los sistemas cerrados de Google, OpenAI y Anthropic.

Diferencias Clave de DeepSeek V4
La eficiencia de DeepSeek V4, que sorprendió incluso a NVIDIA, se debe en gran parte a su arquitectura MoE mejorada. A diferencia de los transformers tradicionales, cuyo coste computacional aumenta con la longitud del contexto, DeepSeek-V4-Pro reduce drásticamente la necesidad de cómputo.
Este modelo requiere solo el 27% de las operaciones de cómputo de su predecesor, DeepSeek-V3.2, y utiliza un 10% del caché KV. Esto se logra mediante un mecanismo híbrido que combina atención dispersa comprimida y atención altamente comprimida, optimizando la selección de información relevante.

Analistas como Dickie Wong de Usmart Securities señalan que la alta eficiencia de DeepSeek impulsa la demanda de hardware, como GPUs y chips Ascend de Huawei, para su ejecución a gran escala.
El modelo mantiene su naturaleza de código abierto, con sus pesos disponibles para descarga en Hugging Face. DeepSeek-V4 Pro ofrece capacidades agénticas mejoradas y un conocimiento del mundo profundo, superado solo por Gemini-3.1 Pro en algunas métricas. La versión V4 Flash presenta un rendimiento comparable en razonamiento y tareas sencillas, con una respuesta más rápida.
Los interesados pueden probar DeepSeek V4 a través de su sitio web o sus aplicaciones para iOS y Android.

