What is Prompt Engineering（提示工程）?

設計和迭代輸入提示以從大型語言模型引出期望輸出的實踐，無需修改模型權重。

Definition

提示工程是設計輸入（提示）以引導語言模型產生有用、準確且格式良好的輸出的藝術和科學。與修改模型內部權重的微調不同，提示工程完全在輸入層工作——改變你問的內容而非模型思考的方式。它涵蓋了從簡單的指令撰寫到複雜的多步驟提示策略，如思維鏈、少樣本學習和思維樹推理。

這門學科的出現是因為大型語言模型對提示措辭高度敏感。同一個問題以略有不同的方式提出可以產生截然不同的答案。提示工程系統性地利用這種敏感性：透過在提示中提供清晰的指令、相關的上下文、輸出格式規範和示範範例，實踐者可以在不進行任何訓練的情況下顯著改善模型在特定任務上的表現。常見技術包括少樣本提示（提供期望的輸入-輸出對範例）、思維鏈提示（要求模型逐步展示其推理）和角色提示（為模型分配一個角色如「專業放射科醫師」）。

雖然提示工程強大且除了推論之外不需要計算資源，但它有固有的局限性。提示會消耗上下文視窗的 token，減少實際內容的可用空間。複雜的提示策略會增加延遲和成本。而且提示本身能達到的效果有上限——當模型儘管經過廣泛的提示優化仍然在領域特定任務上持續失敗時，微調就成為更有效的方法。

Why It Matters

提示工程是改善 LLM 在任務上表現的最快和最低成本的方式。它不需要訓練資料、不需要 GPU 計算、不需要 ML 專業知識——只需要對輸入的仔細迭代。對於許多使用場景，精心設計的提示足以進行生產部署。然而，理解提示工程的局限性同樣重要：它幫助團隊認識到何時應該從僅使用提示的方法升級到微調，微調在領域特定任務上通常比最精心設計的提示帶來 20-50% 的準確度提升。

How It Works

提示工程的工作流程始於撰寫初始提示並對照一組有代表性的輸入進行測試。實踐者評估輸出的品質、準確性和一致性，然後迭代提示——調整指令、添加約束、提供範例或重新組織格式。系統化的評估需要一個帶有預期輸出的基準資料集。提示遊樂場等工具允許快速 A/B 測試不同的提示變體。進階技術包括檢索增強生成（RAG），其中相關上下文在推論時動態檢索並注入提示中，將模型的回應建立在事實資料的基礎上。

Example Use Case

一家 SaaS 公司最初使用提示工程來構建客服聊天機器人，透過精心設計的系統提示和少樣本範例達到 62% 的解決準確率。經過三週的提示迭代，準確率在 68% 處趨於平穩。然後他們使用 Ertas Studio 在 5,000 個已解決的客服工單上微調同一模型，達到 84% 的準確率——提示工程本身無法實現的 16 個百分點的提升。他們繼續將優化的系統提示與微調模型一起使用，結合兩種技術以獲得最佳結果。

Key Takeaways

提示工程透過優化輸入而非權重來改善模型輸出。
關鍵技術包括少樣本提示、思維鏈和角色提示。
它是改善 LLM 效能的最快和最便宜的方式，不需要訓練。
提示工程有效能上限——微調在領域任務上通常能超越它。
最佳結果通常來自微調與精心設計的提示的結合。

How Ertas Helps

Ertas 將微調定位為提示工程達到極限時的自然下一步。平台使這種過渡變得無摩擦：使用者可以將用於少樣本提示的相同範例作為 JSONL 訓練資料上傳，並微調一個將該知識內化到其權重中的模型。Ertas Studio 還允許使用者配置將在模型評估期間使用的系統提示，實現結合提示工程和微調的工作流程，以提供最佳結果。