
LangGraph 代理的微調模型:在你的代理堆疊中替換 GPT-4
LangGraph 代理預設使用 GPT-4,但大多數代理任務——路由、工具選擇、回應生成——使用在你特定工作流程上訓練的微調模型效果更好。
LangGraph 是 2026 年構建有狀態 AI 代理的主流框架。它讓你對代理狀態有明確控制、支援循環和條件分支 ,並處理更簡單框架無法應對的複雜性。如果你在用 Python 構建生產代理,你可能正在使用 LangGraph 或受其嚴重啟發的東西。
每個 LangGraph 教程的預設模式:ChatOpenAI(model="gpt-4o") 作為推理引擎。每個需要思考、路由、摘要或生成的節點都呼叫 GPT-4。每次呼叫都要花錢。
一個典型的帶有 5 個節點的 LangGraph 代理——路由器、研究員、分析師、回應者、審查員——每次任務執行進行 5-15 次 LLM 呼叫。以 GPT-4o 定價,每次執行花費 $0.05-$0.30。每天運行 1,000 個任務,你每天花費 $50-$300,即每月 $1,500-$9,000。僅推論費用。
這些 LLM 呼叫中的大多數不需要 GPT-4。它們需要一個了解你的特定工具、你的特定路由邏輯和你的特定輸出格式的模型。這就是微調給你的。
分解每個代理節點實際做什麼
LangGraph 代理是節點圖,每個節點執行特定功能。讓我們分類每種節點類型從 LLM 實際需要什麼:
路由器節點(分類)
路由器查看傳入的請求並決定代理應該走哪條路徑。「這是一個帳單問題、技術支援問題還是銷售詢問?」這是一個有固定類別集的分類任務。
GPT-4 在定義明確的類別上的分類準確率:約 95-98%。在相同類別上的微調 8B 模型準確率:約 96-99%。微調模型通常更準確,因為它只在你的類別上訓練,不會幻覺不存在的類別。
工具選擇節點(結構化輸出)
代理決定呼叫哪個工具並生成參數。「呼叫帶 {"query": "refund policy", "category": "billing"} 的 search_knowledge_base。」這是結構化輸出生成——模型需要輸出符合特定 schema 的有效 JSON。
微調模型在這裡表現出色。它們學習你確切的工具名稱、你確切的參數 schema 和你確切的呼叫慣例。不再有幻覺的函數名稱或錯誤的參數類型。詳細分析請見我們的 Fine-Tuning for Tool Calling。