DeepSeek V4
BenchLM Aggregate: 87
DeepSeek V4 lidera actualmente el índice agregado de inteligencia BenchLM con 87 — ligeramente por delante de Kimi K2.6 y muy por encima de cualquier otro modelo de pesos abiertos. La variante V4 Pro (1,6T total / 49B activos en arquitectura MoE), combinada con su ventana de contexto de 1M tokens, reduce la distancia con los modelos cerrados de frontera más que cualquier lanzamiento abierto anterior. La licencia DeepSeek es lo suficientemente permisiva para casi todos los casos de uso comerciales. La desventaja es la escala — desplegar V4 Pro requiere infraestructura de servidor con varias GPU, lo que lo deja fuera del alcance de despliegues con una sola GPU o de clase estación de trabajo.
Strengths
- Modelo de pesos abiertos número 1 en benchmarks agregados de inteligencia
- Ventana de contexto de 1M tokens con la eficiencia de DeepSeek Sparse Attention
- Modo de pensamiento unificado en un único checkpoint (sin necesidad de un despliegue separado tipo R1)
- La licencia DeepSeek es ampliamente compatible con uso comercial
Trade-offs
- V4 Pro requiere un servidor multi-GPU (8x A100 80GB o equivalente) — no se puede desplegar en una estación de trabajo
- La variante V4 Flash, más pequeña, sigue requiriendo al menos 4 GPU