What is GEPA（廣義經驗式程序習得）?

Generalized Experience-based Procedural Acquisition——一種 AI 智慧體的自我提升機制，從成功完成的任務中創建可重複使用的技能，並透過反覆使用持續精煉，由 Nous Research 的 Hermes Agent 框架推廣。

Definition

GEPA（Generalized Experience-based Procedural Acquisition，廣義經驗式程序習得）是一種 AI 智慧體的自我提升機制，可將成功完成的任務經驗轉化為可重複使用的「技能」，供智慧體在未來類似任務中調用。具備 GEPA 的智慧體不必每項任務都從零開始，而是會逐步累積一座源自自身成功完成的技能庫——這些技能本身也會透過反覆使用而精煉，隨時間變得更快、更可靠。

此模式由 Nous Research 在其 Hermes Agent 框架中提出（2026 年 2 月發布，並以 ICLR 2026 Oral 論文形式發表）。技能本身是 LLM 可讀的程式碼或結構化提示，因此可被檢視與編輯，而非如黑箱式學習權重般不透明。Nous 的實證結果顯示，Hermes 智慧體在累積 20 個以上自行產生的技能後，於重複任務上約能提速 40%——加速來自於技能重用，而非重新推導解法。GEPA 是長期被討論的「持續精進智慧體」模式的具體實作，與一次性的微調做法明顯不同。

Why It Matters

多數智慧體系統將每項任務視為獨立——今天解決了一個複雜問題的智慧體，明天遇到類似問題仍會重複大部分相同的推理。GEPA 改變了這一點，將智慧體累積的經驗視為一級成果：技能會被持久化、精煉與重用。對於長期執行的量產智慧體部署而言，這能在不需持續微調的前提下，隨時間累積能力提升。此模式也自然形成了訓練資料的回饋迴圈：技能可被匯出，作為微調資料用以更新底層基礎模型。

Key Takeaways

GEPA 智慧體會從成功完成的任務中創建可重複使用的技能
技能是可檢視的程式碼或結構化提示——而非不透明的學習權重
Hermes 智慧體展現出在累積 20 個以上技能後，重複任務約提速 40%
此模式可在不持續微調的情況下實現自我提升
技能可匯出作為微調資料，形成持續複利的提升迴圈

How Ertas Helps

在量產環境部署 Hermes Agent 或其他啟用 GEPA 的框架時，Ertas Studio 支援提升鏈路中的下一個迴圈：將智慧體累積的 GEPA 技能庫匯出為訓練資料，再以智慧體自行產生的程序性知識微調底層基礎模型。微調後的模型會在最常見的模式上表現更佳，降低常見任務對技能庫查詢的依賴，同時保留以技能處理新型任務的能力。