EdTech AI 降本：用微調學科模型取代 OpenAI API 呼叫

一個擁有 20,000 名活躍學習者並進行 AI 輔導課程的 EdTech 平台，每月產生 200,000 到 600,000 次 API 呼叫。以 GPT-4o 的定價，這是每月 2,000 到 9,000 美元，且隨用戶線性增長。對於每月向用戶收費 30 美元的平台，僅 AI 基礎設施成本就可能達到收入的 3% 到 10%。

在本地運行的微調模型以每月 30 到 60 美元的 VPS 成本處理相同的輔導量。初始投資——訓練和部署——在 1 到 3 個月內收回成本。

EdTech API 成本從何而來

輔導和問答： 學生就課程內容提問。每次互動是多輪對話。平均成本：每輪對話 0.004 到 0.012 美元。

書面作業的自動回饋： 學生提交簡答、文章或編碼練習。回饋生成：每次提交 0.02 到 0.08 美元。

自適應測驗生成： 根據學生表現創建個性化練習題。每次測驗成本：0.01 到 0.04 美元。

進度摘要： 課後摘要、學習路徑建議。每名學生每次課：0.005 到 0.015 美元。

20,000 名學生，每次學習課 3 次 AI 互動，每週 4 次課：每週 240,000 次互動，每月約 960,000 次。即使每次互動平均成本 0.005 美元：每月 4,800 美元。

成本降低計算

用例	API 成本 (GPT-4o)	本地模型成本	降幅
輔導聊天（每 1,000 條訊息）	5-12 美元	0.02 美元（計算）	97%+
書面回饋（每 1,000 次提交）	20-80 美元	0.10 美元（計算）	99%+
測驗生成（每 1,000 次測驗）	10-40 美元	0.05 美元（計算）	99%+
進度摘要（每 1,000 次課）	5-15 美元	0.02 美元（計算）	99%+

與規模化的按令牌 API 定價相比，本地計算成本（電力 + VPS）基本上是四捨五入的誤差。

哪些需要微調與哪些可以提示

並非所有 EdTech AI 用例都從微調中獲益相同：

需要微調的：

學科特定輔導（數學、科學、語言）——領域準確性和課程意識很重要
基於評分標準的自動回饋——成績校準需要學習評分標準
自適應內容生成——了解你課程的範圍和順序
課程特定問答——了解你的具體內容、政策和流程

提示通用模型可能已足夠：

通用寫作回饋（語法、結構）
排程和行政問題
不與課程內容掛鉤的通用學習技巧

高量用例（輔導、回饋）正是微調提供成本節省和準確率提升的地方。這些也是 API 成本複合最快的地方。

技術架構

基礎設施設置：

EdTech 平台 (LMS)
    ↓
API 閘道（處理速率限制、身分驗證、路由）
    ↓
負載平衡器（跨 Ollama 實例分佈）
    ↓
Ollama 伺服器 — 提供微調學科模型
    ↓
PostgreSQL（記錄所有互動用於未來訓練資料）

擴展考量：

在每月 40 美元的 VPS（4 核 vCPU，8GB RAM）上的單個 Ollama 實例，使用 7B 模型可以處理 30 到 50 個並發用戶
20,000 名活躍用戶，10% 並發峰值 = 2,000 個並發用戶 = 40 到 67 個實例
每個 40 美元/月：規模化後每月 1,600 到 2,680 美元

等等——這比 API 成本還多？

關鍵： 峰值並發不是活躍用戶的 10%。對於異步學習平台（學生按自己的時間表完成模組），峰值並發是活躍用戶的 1% 到 3%。20,000 名學生 × 2% 並發 = 400 個並發 = 8 到 13 個 Ollama 實例 = 每月 320 到 520 美元。

對於有同步峰值時段的直播課程平台（所有學生同時在課），你需要突發容量。Hetzner 或 Fly.io 上的水平擴展通過自動擴展處理這一問題。

遷移路徑：在完全替換前先混合

不要一次性切換所有流量。使用混合方法：

第一階段（第 1-4 週）： 訓練模型，在 5% 的輔導流量上進行測試。比較準確率指標和用戶滿意度分數。

第二階段（第 5-8 週）： 將 30% 的流量路由到微調模型。監控回退情況，記錄所有互動用於評估。

第三階段（第 9-12 週）： 主要用例（輔導）完全遷移。保留 GPT-4 回退用於邊緣案例和新主題領域。

第四階段（第 4 個月及以後）： 使用收集的互動資料重新訓練。準確率提高；剩餘的 GPT-4 邊緣案例減少。

準確率現實檢驗

對於構建良好的學科特定輔導模型（超過 1,000 個品質訓練樣本）：

課程內問題（90% 的量）： 88% 到 94% 的準確率，與帶有學科特定提示的 GPT-4 相當
邊緣案例和新穎措辭（10% 的量）： 70% 到 80% 的準確率——路由到 GPT-4 回退或標記為人工審閱
超出範圍的請求： 通過訓練處理良好（模型適當地重新引導）

關鍵洞察：你的學生正在詢問關於你的課程的問題。根據你的課程校準的模型，在你的學生所問的問題上，比通用模型表現更好。

Ship AI that runs on your users' devices.

Free plan with 30 credits/mo, no card required. Paid plans from $25/mo USD.

or view pricing →

EdTech AI 降本：用微調學科模型取代 OpenAI API 呼叫

EdTech API 成本從何而來

成本降低計算

哪些需要微調與哪些可以提示

技術架構

遷移路徑：在完全替換前先混合

準確率現實檢驗

延伸閱讀

Ship AI that runs on your users' devices.

Keep reading

為 EdTech 微調輔導 AI：不幻覺課程的學科專用模型

為行銷代理商客戶構建品牌聲音模型

內容代理商如何用微調本地模型將 AI 成本降低 80%