DeepSeek V4
BenchLM Aggregate: 87
DeepSeek V4 es la opción de pesos abiertos más fuerte para cargas de razonamiento general en 2026. A diferencia de DeepSeek-R1 (que es exclusivamente de razonamiento), V4 incorpora un selector unificado de modo de pensamiento dentro de un único checkpoint de chat — respuestas directas rápidas para consultas rutinarias y razonamiento extendido cuando se activa explícitamente o cuando el modelo detecta que aporta beneficio. La variante V4 Pro lidera actualmente el índice agregado de inteligencia BenchLM con 87, con sólidas puntuaciones en AIME, GPQA Diamond y razonamiento complejo de código. La arquitectura unificada sustituye la complejidad operativa de mantener despliegues separados de R1 y V3.
Strengths
- Modo de pensamiento unificado en un único checkpoint — simplicidad operativa
- Puntuación agregada BenchLM de 87 (líder actual de pesos abiertos)
- Ventana de contexto de 1M tokens con DeepSeek Sparse Attention
- Sólido en múltiples benchmarks de razonamiento (AIME, GPQA, código complejo)
Trade-offs
- Se requiere despliegue en servidor multi-GPU (4-8 GPU)
- Aún se prefieren V3.2 / R1, exclusivos de razonamiento, cuando el razonamiento es la única tarea