What is GEPA(廣義經驗式程序習得)?

    Generalized Experience-based Procedural Acquisition——一種 AI 智慧體的自我提升機制,從成功完成的任務中創建可重複使用的技能,並透過反覆使用持續精煉,由 Nous Research 的 Hermes Agent 框架推廣。

    Definition

    GEPA(Generalized Experience-based Procedural Acquisition,廣義經驗式程序習得)是一種 AI 智慧體的自我提升機制,可將成功完成的任務經驗轉化為可重複使用的「技能」,供智慧體在未來類似任務中調用。具備 GEPA 的智慧體不必每項任務都從零開始,而是會逐步累積一座源自自身成功完成的技能庫——這些技能本身也會透過反覆使用而精煉,隨時間變得更快、更可靠。

    此模式由 Nous Research 在其 Hermes Agent 框架中提出(2026 年 2 月發布,並以 ICLR 2026 Oral 論文形式發表)。技能本身是 LLM 可讀的程式碼或結構化提示,因此可被檢視與編輯,而非如黑箱式學習權重般不透明。Nous 的實證結果顯示,Hermes 智慧體在累積 20 個以上自行產生的技能後,於重複任務上約能提速 40%——加速來自於技能重用,而非重新推導解法。GEPA 是長期被討論的「持續精進智慧體」模式的具體實作,與一次性的微調做法明顯不同。

    Why It Matters

    多數智慧體系統將每項任務視為獨立——今天解決了一個複雜問題的智慧體,明天遇到類似問題仍會重複大部分相同的推理。GEPA 改變了這一點,將智慧體累積的經驗視為一級成果:技能會被持久化、精煉與重用。對於長期執行的量產智慧體部署而言,這能在不需持續微調的前提下,隨時間累積能力提升。此模式也自然形成了訓練資料的回饋迴圈:技能可被匯出,作為微調資料用以更新底層基礎模型。

    Key Takeaways

    • GEPA 智慧體會從成功完成的任務中創建可重複使用的技能
    • 技能是可檢視的程式碼或結構化提示——而非不透明的學習權重
    • Hermes 智慧體展現出在累積 20 個以上技能後,重複任務約提速 40%
    • 此模式可在不持續微調的情況下實現自我提升
    • 技能可匯出作為微調資料,形成持續複利的提升迴圈

    How Ertas Helps

    在量產環境部署 Hermes Agent 或其他啟用 GEPA 的框架時,Ertas Studio 支援提升鏈路中的下一個迴圈:將智慧體累積的 GEPA 技能庫匯出為訓練資料,再以智慧體自行產生的程序性知識微調底層基礎模型。微調後的模型會在最常見的模式上表現更佳,降低常見任務對技能庫查詢的依賴,同時保留以技能處理新型任務的能力。

    Related Resources

    Ship AI that runs on your users' devices.

    Early bird pricing starts at $14.50/mo — locked in for life. Plans for builders and agencies.