Back to blog
    使用微調模型構建定期收入 AI 服務
    agencyrecurring-revenuebusiness-modelpricingproductized-servicesegment:agency

    使用微調模型構建定期收入 AI 服務

    如何圍繞微調模型構建 AI 代理商服務,以生成可預測的每月定期收入——涵蓋服務層級、定價模型和再訓練循環。

    EErtas Team·

    大多數 AI 代理商陷入項目模式。客戶出現,您在 4–8 週內為他們構建定制的東西,交付,發出最終發票,然後開始尋找下一個客戶。收入看起來像鋸齒波——峰值、低谷、峰值、低谷。您總是距離破產只有三個月。

    這不是商業模式。這是有更花哨頭銜的自由職業。

    建立真正業務的代理商——達到每月 $50,000、$100,000、$500,000 收入並保持在那裡的那些——找到了 SaaS 公司十年前找到的同樣的東西:定期收入改變了一切。可預測的收入意味著您可以招聘、投資工具,並停止將每個月都視為生存練習。

    微調模型特別適合定期收入模型。以下是原因和構建方法。

    為什麼微調模型是自然的定期收入

    微調模型不是一次性產品。它是一個需要以下條件的活性系統:

    • 持續托管和服務。 模型每天 24 小時運行。有人需要讓它持續運行。
    • 定期再訓練。 世界在變化。客戶需求在發展。生產資料揭示差距。不再訓練的模型會退化。
    • 監控。 精確度漂移、延遲峰值、使用模式——有人需要觀察儀表板。
    • 最佳化。 新的基礎模型發布。更好的微調技術出現。推理成本下降。客戶想要這些好處。

    這些每一項都是您可以每月收費的服務。客戶無法輕易自己做這些事(這就是他們雇用您的原因),停止任何一項都會降低他們獲得的價值。

    與一次性 API 整合或提示工程項目相比。這些是有明確終點的項目。微調模型是需要持續維護的基礎設施。那就是您的固定費用。

    收入模型

    結構很簡單:

    初始設置費: 數據集創建、首次微調、評估和部署的一次性付款。這涵蓋您的前期人工成本並讓客戶獲得價值。

    月度固定費: 托管、監控、再訓練和最佳化的持續費用。這是您的 MRR。

    設置費通常根據複雜性在 $5,000 到 $15,000 之間:

    • 簡單(單一任務、乾淨資料、標準模型): $5K–$7K。示例:在客戶工單類別上微調的客戶支援分類器。
    • 中等(多任務、需要資料清理、自定義評估): $8K–$12K。示例:分類、提取實體和標記風險的法律文件審查模型。
    • 複雜(多模型管道、自定義資料收集、廣泛評估): $12K–$15K 以上。示例:具有獨立資料提取、分析和報告生成模型的金融分析系統。

    月度固定費是業務所在的地方。讓我們談談如何構建它。

    服務層級結構

    三個層級對大多數代理商效果很好。少於三個您會留錢在桌上。多於三個您會創建吃掉利潤的運營複雜性。

    第一層:基本版——$2,000/月

    客戶獲得:

    • 模型托管和服務(99.5% 正常運行時間 SLA)
    • 基本監控(正常運行時間、延遲、錯誤率)
    • 使用生產資料進行季度再訓練
    • 月度使用報告
    • 電子郵件支援(下一個工作日響應)

    您的成本:

    • Ertas 平台:約 $14.50/月
    • GPU 計算份額:約 $50–150/月(客戶間共享基礎設施)
    • 員工時間:每季度約 2–3 小時再訓練,每月約 1 小時監控
    • 有效月度人工成本:約 $200–400

    您的利潤率: 75–85%

    誰購買這個: 有簡單用例的小型企業。他們需要模型正常工作,不想考慮它。低接觸、高利潤。

    第二層:成長版——$5,000/月

    客戶獲得:

    • 第一層的一切,加上:
    • 專用模型實例(非共享基礎設施)
    • 月度再訓練及性能分析
    • 帶有改進指標的詳細評估報告
    • 優先支援(4 小時響應 SLA)
    • 季度戰略通話討論模型性能和機遇

    您的成本:

    • Ertas 平台:約 $14.50/月
    • 專用 GPU 分配:約 $200–400/月
    • 員工時間:再訓練、評估、報告每月約 4–6 小時
    • 有效月度人工成本:約 $600–1,000

    您的利潤率: 70–80%

    誰購買這個: 模型是其運營重要部分的中型市場公司。他們關心隨時間的性能改進,並希望證明它在改善。

    第三層:企業版——$10,000 以上/月

    客戶獲得:

    • 第二層的一切,加上:
    • 多個模型或多模型管道
    • 持續改進(雙週再訓練週期)
    • 自定義評估框架
    • 專屬客戶經理
    • 與利益相關者的月度績效審查
    • 緊急更改的優先部署
    • 自定義整合支援

    您的成本:

    • Ertas 平台:約 $14.50/月(每個模型實例)
    • GPU 分配:約 $500–1,500/月
    • 員工時間:約 15–25 小時/月(客戶管理、再訓練、自定義工作)
    • 有效月度人工成本:約 $2,000–4,000

    您的利潤率: 60–75%

    誰購買這個: 較大的公司或 AI 是其業務核心的公司。高接觸,但每個客戶的絕對利潤是最大的。

    再訓練循環作為價值驅動因素

    以下是使定期模型奏效的關鍵洞見:再訓練循環是固定費用合理性的所在。

    沒有再訓練,客戶可以爭辯說他們應該只為托管付費(這很便宜)並到此為止。再訓練循環創造了複利價值:

    1. 收集生產資料。 每個推理請求都生成資料——輸入、輸出,以及(理想情況下)關於輸出是否有用的反饋。

    2. 分析性能。 識別模型表現不佳的類別、用戶查詢中的新模式,以及原始訓練集中沒有的邊緣案例。

    3. 再訓練。 將新資料整合到訓練集中。在擴展的資料集上微調適配器。針對黃金測試集進行評估。

    4. 展示改進。 向客戶提供具體指標:「上個月,在加入 342 個來自生產的新訓練示例後,與退款相關查詢的精確度從 89% 提升到 94%。」

    5. 證明固定費用合理。 客戶每個月都看到可衡量的改進。他們的模型隨時間變得更好,而不是更差。這值 $2K–$10K/月。

    這創造了一個飛輪。更多的生產使用產生更多的訓練資料,實現更好的再訓練,改善模型,推動更多的生產使用。客戶的模型使用越多就越好——他們需要您的服務來實現這一點。

    量化改進

    始終展示數字。不是「模型有所改進」的模糊聲明。具體指標:

    月度績效報告——2026 年 3 月
    
    再訓練摘要:
    - 新增訓練示例:487 個
    - 來源:帶有人工反饋標籤的生產資料
    - 訓練時間:A100 上 2.3 小時
    
    績效比較:
    | 指標              | 2026 年 2 月 | 2026 年 3 月 | 變化  |
    |---------------------|----------|----------|---------|
    | 整體精確度    | 92.3%    | 94.1%    | +1.8%   |
    | 退款查詢      | 89.1%    | 94.2%    | +5.1%   |
    | 配送查詢    | 95.7%    | 96.1%    | +0.4%   |
    | 幻覺率  | 3.4%     | 2.1%     | -1.3%   |
    | 平均響應時間   | 1.4 秒     | 1.2 秒     | -0.2 秒   |
    
    成本影響:
    - 估計等效 API 成本:$4,200/月
    - 您當前的成本:$2,000/月(第一層)
    - 每月節省:$2,200
    - 自部署以來累計節省:$14,800
    

    最後一節——成本比較——是您擁有的最強大的留存工具。每個月,向客戶展示他們為等效 API 訪問所要支付的費用。API 成本和您的固定費用之間的差距就是您提供的價值。

    初始構建定價

    設置費需要涵蓋您的成本並傳達價值。以下是思考方式:

    初始構建的實際成本:

    • 資料集創建/清理:10–30 小時人工
    • 微調運行(實驗 + 最終):計算 $20–100
    • 評估和 QA:4–8 小時人工
    • 部署和整合:4–8 小時人工
    • 總人工:20–50 小時

    以技術熟練工程師的加載成本 $75–100/小時計算,您的成本為 $1,500–$5,000。定價在 $5K–$15K 可以在構建上獲得健康的利潤,並且相對於持續固定費用不會產生定價衝擊。

    不要對構建定價過低

    一些代理商以成本價(甚至以下)為初始構建定價,以「讓客戶進門」從而獲得固定費用。這是個錯誤,原因有兩個:

    1. 它吸引了對價格敏感的客戶,而這些客戶在固定費用上也會與您周旋。
    2. 它表明您的工作不有價值,這使得固定費用更難以證明合理。

    對構建收取公平價格。如果客戶對 $8,000 的設置費感到猶豫,他們對 $5,000/月的固定費用也會猶豫。最好現在就知道。

    您的成本結構

    讓我們透明地說明這個業務實際上的運行成本:

    每個客戶的可變成本:

    • Ertas 平台:$14.50/月
    • GPU 計算(共享):$50–400/月,具體取決於層級
    • 員工時間:1–25 小時/月,具體取決於層級

    固定成本(不按客戶擴展):

    • 您的基礎設施(監控工具、CI/CD 等):$200–500/月
    • 管理業務的時間:無價(且在利潤率計算中未計算)

    10 個客戶的數學:

    指標金額
    4 × 第一層 @ $2K$8,000
    4 × 第二層 @ $5K$20,000
    2 × 第三層 @ $10K$20,000
    月度收入$48,000
    總 Ertas 費用$145
    總 GPU 計算$3,000
    總員工時間約 80 小時
    員工成本(@ $80/小時)$6,400
    固定開銷$500
    總成本$10,045
    毛利潤$37,955(79%)

    10 個客戶 $48,000 MRR 的 79% 毛利潤。這是一個全職人員只做模型運營的情況。實際上,許多代理商在早期階段運行得更精簡。

    銷售話術框架

    當您與潛在客戶面談時,以下是成交的框架:

    步驟 1:量化他們當前的支出。 「您每月進行多少次 API 調用?費用是多少?」每月在 API 調用上花費超過 $3,000 的大多數企業都是候選者。

    步驟 2:展示節省。 「您每月在 OpenAI API 調用上為客戶支援花費 $5,000。我們可以為您構建一個在本地運行的微調模型,費用為 $2,000/月——相同的品質,資料不離開您的基礎設施,而且它每個月都會變得更好。」

    步驟 3:添加隱私角度。 「現在,每次客戶對話都通過第三方 API。使用本地模型,您的資料保留在您的基礎設施上。對於處理[醫療/金融/法律]資料的公司,這不僅僅是個加分項。」

    步驟 4:展示改進曲線。 「API 模型不會隨時間在您的特定任務上變得更好。我們的會。每個月,我們在您的生產資料上進行再訓練並向您展示指標。三個月後,模型對您的業務的了解將超過任何通用 API 所能達到的。」

    步驟 5:提出要求。 「設置費是 $[X],月度服務是 $[Y]。我們可以在 3 週內讓您的第一個模型投入生產。」

    留存策略

    獲得客戶很難。如果您做到以下幾點,留住他們應該很容易:

    月度績效報告。 不是可選的。每個客戶,每個月,都收到顯示模型性能和改進情況的報告。這是最有效的單一留存工具。

    擴展到額外用例。 您有客戶支援模型的第一層客戶?三個月後,問他們:「您想添加產品推薦模型嗎?相同的基礎設施,相同的月度節奏。我們可以以額外 $1,500/月的費用將其添加到您的計劃中。」擴展收入比新客戶獲取更容易。

    讓自己不可或缺。 通過您的系統流動的生產資料越多,客戶離開就越難。不是因為您在鎖定他們——他們擁有他們的模型和資料——而是用另一個提供商重建訓練管道、評估框架和監控基礎設施的轉換成本是真實的。

    季度業務審查。 對於第二層和第三層客戶,安排與決策者(不僅僅是他們的技術聯繫人)的季度通話。展示交付的累計價值。討論他們的路線圖。提出 AI 可以幫助解決他們下一個挑戰的方法。這是 $5,000/月客戶變成 $15,000/月客戶的方式。

    年度定價。 為年度承諾提供 10–15% 的折扣。這減少了流失並為規劃提供了可預測的收入。按年度合同支付 $54,000/年的客戶比在第 7 個月可能流失、每月支付 $5,000 的客戶更有價值。

    Ship AI that runs on your users' devices.

    Ertas early bird pricing starts at $14.50/mo — locked in for life. Plans for builders and agencies.

    複利優勢

    這種模型的美妙之處在於它會複利。每個月您的運營變得更高效:

    • 再訓練管道進一步自動化
    • 評估框架在客戶間重複使用
    • 您發展出使新客戶引導更快的領域專業知識
    • 您的基礎模型基礎設施在沒有比例成本增加的情況下服務更多客戶

    第 1 個月,您在客戶的再訓練週期上花費 20 小時。第 6 個月,因為您已自動化了一切,只需 4 小時。但固定費用保持不變。您的利潤在不提高價格的情況下提升。

    在 20 個客戶時,您的固定成本被分散,每個客戶的可變成本被最佳化,您的毛利潤接近 85%。這是基於微調模型的產品化服務的經濟學。

    停止用時間換金錢。開始建立定期收入。


    有關代理商定價的更多信息,請閱讀我們關於產品化 AI 微調服務AI 代理商定價策略為客戶定價自托管模型的指南。

    Ship AI that runs on your users' devices.

    Early bird pricing starts at $14.50/mo — locked in for life. Plans for builders and agencies.

    Keep reading