DeepSeek V4
BenchLM 綜合分數: 87
DeepSeek V4 目前以 87 分領先 BenchLM 綜合智慧指數——以微幅優勢領先 Kimi K2.6,並大幅領先所有其他開放權重模型。V4 Pro 變體(1.6T 總參數 / 49B 活躍 MoE)結合其 1M token 上下文視窗,將與前沿閉源模型的差距縮小到任何先前開放權重發布都無法企及的程度。DeepSeek 授權對幾乎所有商業使用情境都足夠寬鬆。缺點在於規模——V4 Pro 部署需要多 GPU 伺服器基礎設施,使單 GPU 或工作站等級的部署無法觸及。
Strengths
- 目前在綜合智慧基準測試中名列開放權重模型第 1
- 1M token 上下文視窗搭配 DeepSeek 稀疏注意力機制提升效率
- 在單一檢查點中統一思考模式(無需另外部署 R1 風格模型)
- DeepSeek 授權條款廣泛地對商業應用友善
Trade-offs
- V4 Pro 需要多 GPU 伺服器(8 張 A100 80GB 或同等配置)——無法在工作站部署
- 較小的 V4 Flash 變體仍至少需要 4 張 GPU