Active Learning(主動學習)
技術一種機器學習方法,模型有選擇性地向人類標註者查詢,標記最具資訊價值的範例,以最大化每個已標記樣本的學習效率。
Key terms and concepts explained simply.
一種機器學習方法,模型有選擇性地向人類標註者查詢,標記最具資訊價值的範例,以最大化每個已標記樣本的學習效率。
一組插入到凍結預訓練模型中的小型可訓練參數,能在不修改原始模型權重的情況下實現高效微調。
一種多智慧體編排模式,由協調者智慧體將工作分派給多個並行子智慧體,再彙整其結果——2026 年由 Kimi K2.6 的 Agent Swarm 執行環境推廣,可擴展至 300 個子智慧體與 4,000 個推理步驟。
一種設計範式,AI 系統能自主規劃、推理、使用工具並執行多步驟工作流程——超越單輪問答,實現持續的、目標導向的行為。
由 AI 智慧體執行的軟體工程:規劃跨多檔案的修改、在整個程式碼庫中執行修改,並依測試或建置回饋反覆迭代——以 SWE-Bench Verified 與 SWE-Bench Pro 等基準衡量。
一種自主軟體系統,使用大型語言模型感知環境、做出決策並採取行動來實現目標——通常具備存取檔案系統、API、瀏覽器和訊息平台等工具的能力。
由人類標註者或自動化系統為原始資料添加結構化元資料、標籤或標記的過程,以建立用於監督式學習的訓練資料集。
Transformer 模型中的一種機制,允許每個 token 在計算其表示時動態加權並關注輸入序列中最相關的部分。
Activation-aware Weight Quantization——一種 4-bit 量化方法,依活化值大小保護關鍵權重,在相同位元寬下產生比樸素量化更高品質的壓縮模型。
一個在大型通用語料庫上預訓練的基礎模型,作為針對領域特定任務進行微調的起點。
在模型訓練的一次前向-反向傳遞中同時 處理的訓練範例數量,影響記憶體使用、訓練速度和收斂行為。
一套具有明確任務和指標的標準化測試套件,用於評估和比較不同模型和配置下的語言模型表現。
一種透過測量生成輸出與一個或多個人類參考文字之間的 n-gram 重疊來評估機器生成文字品質的指標。
一種現象,神經網路在新資料上微調時失去先前學習的知識,導致之前表現良好的任務上效能下降。
一種格式化結構,定義對話訊息(系統、使用者、助手)如何被分詞並排列為語言模型的輸入。
在訓練特定時間點保存的模型權重和訓練狀態快照,用於恢復、評估和選擇最佳效能版本。
一種 AI 智慧體架構,LLM 以撰寫並執行 Python(或其他語言)程式碼作為主要動作格式,而非透過 JSON 函式呼叫從固定工具清單中挑選——由 Hugging Face 的 smolagents 框架推廣。
語言模型在單次輸入輸出序列中能處理的最大 token 數量,決定了模型一次能「看到」多少文字。
一組透過建立現有資料點的修改副本來人為增加訓練資料集大小和多樣性的技術。
識別並移除資料集中重複或近重複項目的過程,以防止記憶化偽影並提高訓練效率。
將有意義的標籤、類別或標註分配給原始資料的過程,使機器學習模型能夠從結構化範例中學習。
追蹤資料從來源經過每個轉換、處理步驟和模型訓練使用的實踐,以維持完整的稽核軌跡。
追蹤和管理資料集隨時間推移的不同版本,實現機器學習工作流程中的可重現性、回滾和可稽核性。
DeepSeek-V3.2 引入並於 V4 延續的可學習稀疏 注意力機制,每個查詢 token 僅指向部分鍵 token,而非對所有 token 計算注意力,大幅降低長脈絡推論的運算成本。
調整在通用資料上訓練的模型以在特定領域(如醫療、法律或金融)中表現良好的過程。
RLHF 的更簡單替代方案,直接在人類偏好資料上優化語言模型,無需單獨的獎勵模型或強化學習。
在終端使用者裝置或邊緣伺服器上本地運行 AI 模型推論,而非在集中式雲端資料中心,實現離線操作和資料隱私。
模型在所宣稱脈絡視窗中,實際仍能維持高檢索準確度的部分——通常遠短於宣稱上限,目前多數模型在脈絡中段的資訊損失可達 10-25%。
token、詞或段落在連續數學空間中的密集向量表示,語義相似性對應幾何鄰近性。
在模型微調過程中完整通過整個訓練資料集一次。
一種技術,模型僅從少量標記範例中學習執行任務,通常作為提示中的示範提供。
取得預訓練 AI 模型並在更小的領域特定資料集上進一步訓練的過程,以針對特定任務或行業專業化其能力。
允許語言模型生成帶有適當參數的結構化函數調用的能力,使其能與外部工具和 API 互動。
Generalized Experience-based Procedural Acquisition——一種 AI 智慧體的自我提升機制,從成功完成的任務中創建可重複使用的技能,並透過反覆使用持續精煉,由 Nous Research 的 Hermes Agent 框架推廣。
一種用於儲存量化大型語言模型的二進位檔案格式,針對透過 llama.cpp 和相容執行時進行快速載入和高效 CPU 及 GPU 推論而優化。
Generalized Post-Training Quantization——一種 4-bit 權重量化方法,使用校正資料集的二階資訊逐層最小化量化誤差,產出比樸素量化更高品質的壓縮模型。