DeepSeek V4
長脈絡 RAG: 同類最佳
DeepSeek V4 的 1M 詞元脈絡視窗搭配 DeepSeek Sparse Attention(DSA),使其成為 RAG 流程中需要對大量檢索結果進行推理的最強開放權重之選。DSA 在密集注意力模型會出現顯著「中段遺失」效應的長脈絡長度下,仍能維持可用的檢索品質。配合 V4 居領先地位的整體智慧水準(BenchLM 87)以及可彈性調整推理深度的統一思考模式,V4 能處理較小脈絡替代品難以勝任的複雜多文件 RAG 查詢。
Strengths
- 1M 詞元脈絡搭配 DSA 稀疏注意力效率
- 在檢索基準上有同類最佳的有效脈絡長度
- 統一思考模式可彈性調整 RAG 回應品質
- 開放權重選項中整體智慧水準最高
Trade-offs
- 需多 GPU 伺服器部署(4-8 張 GPU)
- 雖採 MoE 架構,大規模時推論成本仍可觀