
AI代理商定價策略:訂閱vs按令牌直通
當底層成本是按令牌計費時,如何為您的AI代理商服務定價。比較訂閱、按令牌直通和混合定價模式——以及為什麼微調本地模型解鎖了最佳選項。
如果您經營AI代理商,您幾乎肯定盯著這個問題看過:您的客戶想要可預測的月度發票,但您的成本隨著通過雲端API處理的每個令牌而擴展。2026年AI代理商經濟中,固定價格預期與可變成本基礎設施之間的不匹配是核心張力。
定價錯誤,您要麼在重度使用客戶身上流失利潤,要麼因為報價看起來太貴而失去交易。定價正確,您建立一個複利、可擴展的業務。本文分析三種主要定價模式、其權衡,以及為什麼微調本地模型從根本上改變了計算。
定價困境
傳統軟體代理商按時間和材料或固定項目費用定價。兩種模式都有效,因為運行軟體的邊際成本接近於零——一旦代碼編寫完成,託管成本是可預測的。
AI代理商沒有這種奢侈。每次對OpenAI、Anthropic或Google的推論呼叫都花費真實的錢。每天發送10,000個請求的客戶比發送100個的客戶花費您戲劇性地更多。然而兩個客戶都期待相同的固定月費。
這創造了一個危險的動態。您要麼用足夠的緩衝填充您的定價以覆蓋最壞情況的使用(使您失去競爭力),要麼為平均使用定價並希望沒有客戶大量使用(冒著負利潤的風險)。
三種定價模式比較
1. 固定訂閱
客戶為訪問您的AI驅動產品或服務支付固定的月費。簡單、可預測,正是客戶想要的。
優點: 易於銷售、可預測收入、客戶喜歡、高感知價值。
缺點: 您承擔所有使用差異。一個重度使用客戶可能在當月破壞您的利潤。需要準確的使用預測,這對新產品來說幾乎不可能。
典型利潤風險: 如果您按中位使用定價,大約20%的客戶將超出您的成本假設。在雲端API費率下,單個企業客戶的3倍使用峰值可能消除五個正常客戶的利潤。
2. 按令牌直通
您根據實際令牌消耗向客戶收費,通常有加成。透明、公平,但操作複雜。
優點: 零利潤風險、成本始終被覆蓋、自然擴展。
缺點: 客戶討厭不可預測的賬單。需要計量基礎設施。產生摩擦——客戶因每次查詢都要花錢而猶豫使用產品。降低採用率和參與度。
典型利潤: API成本加成30-50%,但總收入受客戶使用產品意願的限制。
3. 混合(基礎+超額)
基礎訂閱覆蓋一個使用層級,超過閾值後按令牌收費。折中方案。
優點: 可預測的基礎收入、防止極端使用、客戶獲得一定成本確定性。
缺點: 複雜難以解釋和銷售。超額費用帶來負面驚喜。需要與直通相同的計量基礎設施。客戶仍然因使用產品而感到被懲罰。
為什麼訂閱勝出——如果您能讓它奏效
每個SaaS定價專家都會告訴您同樣的事情:無限使用的訂閱定價推動最高採用率、最低流失率和最佳生命週期價值。當客戶不擔心每次查詢的成本時,他們會將您的AI更深地整合到工作流程中。更深的整合意味著更高的轉換成本和更低的流失率。
AI代理商避免訂閱定價的唯一原因是成本風險。如果您的每次推論成本是可變的且不可預測的,提供無限使用是一場賭博。
這就是模型所有權轉變改變一切的地方。
微調本地模型如何使訂閱變得安全
當您微調一個較小的開源模型——比如說在客戶特定領域上訓練的7B或8B參數模型——並將其部署在固定成本基礎設施上時,您的成本結構完全轉變。
雲端API成本結構: 可變。您按令牌付費。更多使用意味著更多成本。沒有上限。
自託管微調模型成本結構: 固定。您為服務器(或保留的GPU實例)付費。無論您運行100次推論還是10萬次,每月基礎設施成本保持不變。
這是解鎖因素。有了固定基礎設施成本,訂閱定價不僅可行而且最優。隨著客戶更多地使用產品,您的利潤實際上提高了,因為基礎設施成本被攤銷到更多查詢中。
利潤分析
考慮一個具體例子。一個AI代理商以每月2,000美元服務10個客戶——每月20,000美元收入。
使用雲端API: 每個客戶的平均API成本是每月800美元,但範圍從200美元到3,000美元。總API成本平均8,000美元,但可能峰值至15,000美元。毛利潤每月在25%和60%之間波動。
使用自託管微調模型: 單個GPU服務器每月花費1,500美元,可以輕鬆服務所有10個客戶。毛利潤每個月穩定在92.5%。沒有方差。沒有驚喜。
微調模型不需要在通用基準上匹配GPT-4。它需要在您的客戶需要的特定任務上表現出色——在其領域內分類、提取、生成。在狹窄的特定領域任務上,調整良好的8B模型持續以GPT-4成本的一小部分超越通用的70B模型。
Ertas如何實現固定成本AI基礎設施
Ertas正是為這個工作流程而構建的。使用Ertas Studio在客戶數據上微調特定領域模型,導出優化的GGUF文件,並在您自己的基礎設施上或通過Ertas Cloud部署它們。
該平台處理實驗跟蹤、模型評估和格式轉換——通常使自託管對代理商不切實際的運營開銷。您專注於客戶交付,Ertas處理ML工程管道。
對代理商來說,這意味著您可以自信地提供固定訂閱定價,知道您的成本是固定的,您的利潤是受保護的。不再有試圖預測令牌使用的電子表格體操。不再有與客戶尷尬的超額對話。
結論
您選擇的定價模式塑造您的整個業務。按令牌直通保護您的利潤但限制您的增長。訂閱定價推動採用和留存,但需要成本確定性。微調本地模型給您那種成本確定性。
將主導AI服務下一階段的代理商是那些擁有自己的模型基礎設施、提供簡單訂閱定價並將利潤優勢再投資於更好客戶成果的代理商。
準備好讓訂閱定價對您的代理商可行? 加入Ertas優先預約並開始在固定成本AI基礎設施上構建。
延伸閱讀
Ship AI that runs on your users' devices.
Early bird pricing starts at $14.50/mo — locked in for life. Plans for builders and agencies.
Keep reading

Building a Recurring Revenue AI Service with Fine-Tuned Models
How to structure an AI agency offering around fine-tuned models that generates predictable monthly recurring revenue — covering service tiers, pricing models, and the retraining loop.

How to Scope a Custom AI Model Project (and What to Charge)
The discovery questions, project types, price ranges, and scope management strategies for custom AI model projects. How to scope correctly before you quote anything.

Niche AI Agency vs Generalist: Which Wins Clients in 2026
The data is clear: niche AI agencies close faster, charge more, and retain clients longer. Here's why niching works in AI specifically and how to find yours.