
使用微調模型構建定期收入 AI 服務
如何圍繞微調模型構建 AI 代理商服務,以生成可預測的每月定期收入——涵蓋服務層級、定價模型和再訓練循環。
大多數 AI 代理商陷入項目模式。客戶出現,您在 4–8 週內為他們構建定制的東西,交付,發出最終發票,然後開始尋找下一個客戶。收入看起來像鋸齒波——峰值、低谷、峰值、低谷。您總是距離破產只有三個月。
這不是商業模式。這是有更花哨頭銜的自由職業。
建立真正業務的代理商——達到每月 $50,000、$100,000、$500,000 收入並保持在那裡 的那些——找到了 SaaS 公司十年前找到的同樣的東西:定期收入改變了一切。可預測的收入意味著您可以招聘、投資工具,並停止將每個月都視為生存練習。
微調模型特別適合定期收入模型。以下是原因和構建方法。
為什麼微調模型是自然的定期收入
微調模型不是一次性產品。它是一個需要以下條件的活性系統:
- 持續托管和服務。 模型每天 24 小時運行。有人需要讓它持續運行。
- 定期再訓練。 世界在變化。客戶需求在發展。生產資料揭示差距。不再訓練的模型會退化。
- 監控。 精確度漂移、延遲峰值、使用模式——有人需要觀察儀表板。
- 最佳化。 新的基礎模型發布。更好的微調技術出現。推理成本下降。客戶想要這些好處。
這些每一項都是您可以每月收費的服務。客戶無法輕易自己做這些事(這就是他們雇用您的原因),停止任何一項都會降低他們獲得的價值。
與一次性 API 整合或提示工 程項目相比。這些是有明確終點的項目。微調模型是需要持續維護的基礎設施。那就是您的固定費用。
收入模型
結構很簡單:
初始設置費: 數據集創建、首次微調、評估和部署的一次性付款。這涵蓋您的前期人工成本並讓客戶獲得價值。
月度固定費: 托管、監控、再訓練和最佳化的持續費用。這是您的 MRR。
設置費通常根據複雜性在 $5,000 到 $15,000 之間:
- 簡單(單一任務、乾淨資料、標準模型): $5K–$7K。示例:在客戶工單類別上微調的客戶支援分類器。
- 中等(多任務、需要資料清理、自定義評估): $8K–$12K。示例:分類、提取實體和標記風險的法律文件審查模型。
- 複雜(多模型管道、自定義資料收集、廣泛評估): $12K–$15K 以上。示例:具有獨立資料提取、分析和報告生成模型的金融分析系統。
月度固定費是業務所在的地方。讓我們談談如何構建它。
服務層級結構
三個層級對大多數代理商效果很好。少於三個您會留錢在桌上。多於三個您會創建吃掉利潤的運營複雜性。
第一層:基本版——$2,000/月
客戶獲得:
- 模型托管和服務(99.5% 正常運行時間 SLA)
- 基本監控(正常運行時間、延遲、錯誤率)
- 使用生產資料進行季度再訓練
- 月度使用報告
- 電子郵件支援(下一個工作日響應)
您的成本:
- Ertas 平台:約 $14.50/月
- GPU 計算份額:約 $50–150/月(客戶間共享基礎設施)
- 員工時間:每季度約 2–3 小時再訓練,每月約 1 小時監控
- 有效月度人工成本:約 $200–400
您的利潤率: 75–85%
誰購買這個: 有簡單用例的小型企業。他們需要模型正常工作,不想考慮它。低接觸、高利潤。
第二層:成長版——$5,000/月
客戶獲得:
- 第一層的一切,加上:
- 專用模型實例(非共享基礎設施)
- 月度再訓練及性能分析
- 帶有改進指標的詳細評估報告
- 優先支援(4 小時響應 SLA)
- 季度戰略通話討論模型性能和機遇
您的成本:
- Ertas 平台:約 $14.50/月
- 專用 GPU 分配:約 $200–400/月
- 員工時間:再訓練、評估、報告每月約 4–6 小時
- 有效月度人工成本:約 $600–1,000
您的利潤率: 70–80%
誰購買這個: 模型是其運營重要部分的中型市場公司。他們關心隨時間的性能改進,並希望證明它在改善。
第三層:企業版——$10,000 以上/月
客戶獲得:
- 第二層的一切,加上:
- 多個模型或多模型管道
- 持續改進(雙週再訓練週期)
- 自定義評估框架
- 專屬客戶經理
- 與利益相關者的月度績效審查
- 緊急更改的優先部署
- 自定義整合支援
您的成本:
- Ertas 平台:約 $14.50/月(每個模型實例)
- GPU 分配:約 $500–1,500/月
- 員工時間:約 15–25 小時/月(客戶管理、再訓練、自定義工作)
- 有效月度人工成本:約 $2,000–4,000
您的利潤率: 60–75%
誰購買這個: 較大的公司或 AI 是其業務核心的公司。高接觸,但每個客戶的絕對利潤是最大的。
再訓練循環作為價值驅動因素
以下是使定期模型奏效的關鍵洞見:再訓練循環是固定費用合理性的所在。
沒有再訓練,客戶可以爭辯說他們應該只為托管付費(這很便宜)並到此為止。再訓練循環創造了複利價值:
-
收集生產資料。 每個推理請求都生成資料——輸入、輸出,以及(理想情況下)關於輸出是否有用的反饋。
-
分析性能。 識別模型表現不佳的類別、用戶查詢中的新模式,以及原始訓練集中沒有的邊緣案例。
-
再訓練。 將新資料整合到訓練集中。在擴展的資料集上微調適配器。針對黃金測試集進行評估。
-
展示改進。 向客戶提供具體指標:「上個月,在加入 342 個來自生產的新訓練示例後,與退款相關查詢的精確度從 89% 提升到 94%。」
-
證明固定費用合理。 客戶每個月都看到可衡量的改進。他們的模型隨時間變得更好,而不是更差。這值 $2K–$10K/月。
這創造了一個飛輪。更多的生產使用產生更多的訓練資料,實現更好的再訓練,改善模型,推動更多的生產使用。客戶的模型使用越多就越好——他們需要您的服務來實現這一點。
量化改進
始終展示數字。不是「模型有所改進」的模糊聲明。具體指標:
月度績效報告——2026 年 3 月
再訓練摘要:
- 新增訓練示例:487 個
- 來源:帶有人工反饋標籤的生產資料
- 訓練時間:A100 上 2.3 小時
績效比較:
| 指標 | 2026 年 2 月 | 2026 年 3 月 | 變化 |
|---------------------|----------|----------|---------|
| 整體精確度 | 92.3% | 94.1% | +1.8% |
| 退款查詢 | 89.1% | 94.2% | +5.1% |
| 配送查詢 | 95.7% | 96.1% | +0.4% |
| 幻覺率 | 3.4% | 2.1% | -1.3% |
| 平均響應時間 | 1.4 秒 | 1.2 秒 | -0.2 秒 |
成本影響:
- 估計等效 API 成本:$4,200/月
- 您當前的成本:$2,000/月(第一層)
- 每月節省:$2,200
- 自部署以來累計節省:$14,800
最後一節——成本比較——是您擁有的最強大的留存工具。每個月,向客戶展示他們為等效 API 訪問所要支付的費用。API 成本和您的固定費用之間的差距就是您提供的價值。
初始構建定價
設置費需要涵蓋您的成本並傳達價值。以下是思考方式:
初始構建的實際成本:
- 資料集創建/清理:10–30 小時人工
- 微調運行(實驗 + 最終):計算 $20–100
- 評估和 QA:4–8 小時人工
- 部署和整合:4–8 小時人工
- 總人工:20–50 小時
以技術熟練工程師的加載成本 $75–100/小時計算,您的成本為 $1,500–$5,000。定價在 $5K–$15K 可以在構建上獲得健康的利潤,並且相對於持續固定費用不會產生定價衝擊。
不要對構建定價過低
一些代理商以成本價(甚至以下)為初始構建定價,以「讓客戶進門」從而獲得固定費用。這是個錯誤,原因有兩個:
- 它吸引了對價格敏感的客戶,而這些客戶在固定費用上也會與您周旋。
- 它表明您的工作不有價值,這使得固定費用更難以證明合理。
對構建收取公平價格。如果客戶對 $8,000 的設置費感到猶豫,他們對 $5,000/月的固定費用也會猶豫。最好現在就知道。
您的成本結構
讓我們透明地說明這個業務實際上的運行成本:
每個客戶的可變成本:
- Ertas 平台:$14.50/月
- GPU 計算(共享):$50–400/月,具體取決於層級
- 員工時間:1–25 小時/月,具體取決於層級
固定成本(不按客戶擴展):
- 您的基礎設施(監控工具、CI/CD 等):$200–500/月
- 管理業務的時間:無價(且在利潤率計算中未計算)
10 個客戶的數學:
| 指標 | 金額 |
|---|---|
| 4 × 第一層 @ $2K | $8,000 |
| 4 × 第二層 @ $5K | $20,000 |
| 2 × 第三層 @ $10K | $20,000 |
| 月度收入 | $48,000 |
| 總 Ertas 費用 | $145 |
| 總 GPU 計算 | $3,000 |
| 總員工時間 | 約 80 小時 |
| 員工成本(@ $80/小時) | $6,400 |
| 固定開銷 | $500 |
| 總成本 | $10,045 |
| 毛利潤 | $37,955(79%) |
10 個客戶 $48,000 MRR 的 79% 毛利潤。這是一個全職人員只做模型運營的情況。實際上,許多代理商在早期階段運行得更精簡。
銷售話術框架
當您與潛在客戶面談時,以下是成交的框架:
步驟 1:量化他們當前的支出。 「您每月進行多少次 API 調用?費用是多少?」每月在 API 調用上花費超過 $3,000 的大多數企業都是候選者。
步驟 2:展示節省。 「您每月在 OpenAI API 調用上為客戶支援花費 $5,000。我們可以為您構建一個在本地運行的微調模型,費用為 $2,000/月——相同的品質,資料不離開您的基礎設施,而且它每個月都會變得更好。」
步驟 3:添加隱私角度。 「現在,每次客戶對話 都通過第三方 API。使用本地模型,您的資料保留在您的基礎設施上。對於處理[醫療/金融/法律]資料的公司,這不僅僅是個加分項。」
步驟 4:展示改進曲線。 「API 模型不會隨時間在您的特定任務上變得更好。我們的會。每個月,我們在您的生產資料上進行再訓練並向您展示指標。三個月後,模型對您的業務的了解將超過任何通用 API 所能達到的。」
步驟 5:提出要求。 「設置費是 $[X],月度服務是 $[Y]。我們可以在 3 週內讓您的第一個模型投入生產。」
留存策略
獲得客戶很難。如果您做到以下幾點,留住他們應該很容易:
月度績效報告。 不是可選的。每個客戶,每個月,都收到顯示模型性能和改進情況的報告。這是最有效的單一留存工具。
擴展到額外用例。 您有客戶支援模型的第一層客戶?三個月後,問他們:「您想添加產品推薦模型嗎?相同的基礎設施,相同的月度節奏。我們可以以額外 $1,500/月的費用將其添加到您的計劃中。」擴展收入比新客戶獲取更容易。
讓自 己不可或缺。 通過您的系統流動的生產資料越多,客戶離開就越難。不是因為您在鎖定他們——他們擁有他們的模型和資料——而是用另一個提供商重建訓練管道、評估框架和監控基礎設施的轉換成本是真實的。
季度業務審查。 對於第二層和第三層客戶,安排與決策者(不僅僅是他們的技術聯繫人)的季度通話。展示交付的累計價值。討論他們的路線圖。提出 AI 可以幫助解決他們下一個挑戰的方法。這是 $5,000/月客戶變成 $15,000/月客戶的方式。
年度定價。 為年度承諾提供 10–15% 的折扣。這減少了流失並為規劃提供了可預測的收入。按年度合同支付 $54,000/年的客戶比在第 7 個月可能流失、每月支付 $5,000 的客戶更有價值。
Ship AI that runs on your users' devices.
Ertas early bird pricing starts at $14.50/mo — locked in for life. Plans for builders and agencies.
複利優勢
這種模型的美妙之處在於它會複利。每個月您的運營變得更高效:
- 再訓練管道進一步自動化
- 評估框架在客戶間重複使用
- 您發展出使新客戶引導更快的領域專業知識
- 您的基礎模型基礎設施在沒有比例成本增加的情況下服務更多客戶
第 1 個月,您在客戶的再訓練週期上花費 20 小時。第 6 個月,因為您已自動化了一切,只需 4 小時。但固定費用保持不變。您的利潤在不提高價格的情況下提升。
在 20 個客戶時,您的固定成本被分散,每個客戶的可變成本被最佳化,您的毛利潤接近 85%。這是基於微調模型的產品化服務的經濟學。
停止用時間換金錢。開始建立定期收入。
有關代理商定價的更多信息,請閱讀我們關於產品化 AI 微調服務、AI 代理商定價策略和為客戶定價自托管模型的指南。
Ship AI that runs on your users' devices.
Early bird pricing starts at $14.50/mo — locked in for life. Plans for builders and agencies.
Keep reading

Build Recurring Revenue: The AI Agency Model Maintenance Retainer
Fine-tuned models create a natural retainer structure. Here's how to build $500-2,000/month per client retainers around model maintenance, with the pitch, the pricing, and the infrastructure.

Fine-Tune Once, Charge Monthly: The Productized AI Service Model
How to turn a one-time fine-tuning engagement into a recurring monthly revenue stream. The service model, pricing, and client conversation that makes it work.

How to Price Fine-Tuning Services Profitably (Agency Rate Card)
A concrete rate card and pricing methodology for AI agencies offering fine-tuning services. Stop guessing on price — here's what to charge and how to explain it.