
pricingagencyself-hostingbusiness-modelsegment:agency
為你的 AI 代理商服務定價:使用自託管模型時的固定費率 vs 按 Token 計費
自託管 AI 模型如何改變代理商定價策略。固定費率、按席位和混合定價模型,附帶各 GPU 層級的利潤率範例。
EErtas Team·
大多數 AI 代理商從 API 時代繼承了定價模式:根據使用量向客戶收費,以加成方式轉嫁 API 成本。它可以運作,但它限制了你的利潤率並使收入不可預測。
自託管模型打破了這種動態。你的成本是固定的 GPU 支出,而非按 token 的可變成本。這創造了 API 依賴型代理商無法匹配的定價機會。
本文延伸了 AI 代理商定價策略指南,為運行自託管微調模型的代理商提供具體的定價模型。
階梯函數洞察
API 成本是線性的:更多 token,更多成本。自託管成本是階梯函數:每個 GPU 層級固定成本,該層級內零邊際成本。
這一個事實改變了你應該如何定價的一切:
| 定價模型 | 基於 API 的代理商 | 自託管代理商 |
|---|---|---|
| 成本結構 | 可變(按 token) | 固定(按 GPU 層級) |
| 高使用量客戶的利潤率 | 薄或負值 | 優秀 |
| 收入可預測性 | 低 | 高 |
| 定價靈活性 | 受 COGS 限制 | 寬利潤率範圍 |
| 客戶偏好 | 不可預測的帳單 | 可預測的預算 |
當你的成本是固定的,任何收費超過固定成本的定價模型都會產生利潤。問題不是「我是否負擔得起服務這個客戶?」而是「哪個定價模型最大化我捕捉的價值?」
定價模型 1:固定月費
運作方式: 客戶支付固定月費,在定義的範圍內無限使用 AI。
範例:
- 律師事務所的合約審查 AI:每月 $5,000 固定
- 包含:無限合約審查、每月模型重新訓練、支援
- 你的成本:約 $200/月分攤(GPU 份額、電力、Ertas Studio 席位)
- 毛利率:96%
適用時機:
- 使用量可預測、中等到高的客戶
- 偏好預算確定性的企業客戶
- 使用量增長對你有利的合作(客戶使用更多 → 他們獲得更多價值 → 他們停留更久)
風險:
- 使用量極端的單一客戶可能使你的 GPU 容量飽和
- 通過定義「合理使用範圍內的無限」或設定軟上限來緩解
不同客戶數量的利潤率分析(1 張 RTX 5090,每月 $42 營運成本):
| 客戶數 | 營收(每個 $3,000/月) | GPU 成本 | 毛利率 |
|---|---|---|---|
| 3 | $9,000 | $42 | 99.5% |
| 5 | $15,000 | $42 | 99.7% |
| 10 | $30,000 | $42 | 99.9% |
即使以保守定價,一旦 GPU 回本,利潤率也是驚人的。
定價模型 2:按席位定價
運作方式: 客戶按有權使用 AI 工具的使用者人數付費。
範例:
- AI 驅動的法律研究助理:$200/使用者/月
- 有 15 位律師的事務所:$3,000/月
- 你的成本:約 $200/月分攤
- 毛利率:93%
適用時機:
- 使用量隨員工人數增長的產品
- 以每員工軟體成本思考的客戶
- 當你希 望定價隨客戶成長自然擴展時
優點:
- 企業買家熟悉的定價模型(像 SaaS)
- 當客戶增加使用者時收入自動增長
- 客戶容易編列預算和核准
利潤率分析:
| 每席位價格 | 10 人事務所 | 50 人事務所 | 200 人事務所 |
|---|---|---|---|
| $100/席位 | $1,000/月 | $5,000/月 | $20,000/月 |
| $200/席位 | $2,000/月 | $10,000/月 | $40,000/月 |
| $500/席位 | $5,000/月 | $25,000/月 | $100,000/月 |
無論席位數量多少,你的 GPU 成本都相同(直到達到容量限制)。大型事務所的按席位定價利潤極其豐厚。
定價模型 3:按專案或按合約
運作方式: 客戶為定義的專案支付固定費用(例如審查特定文件集)。
範例:
- 併購交易的盡職調查審查:每筆交易 $15,000
- 包含:AI 輔助審查最多 5,000 份文件、摘要報告、風險分析
- 你的成本:2-3 天的代理商時間 + 可忽略的運算成本
- 毛利率:70-80%(低於月費因為包含人力)
適用時機:
- 基於交易的工作(併購、訴訟文件審查)
- 尚未準備好月度承諾的客戶
- 輸出明確與業務成果掛鉤的高價值合作
優點:
- 定價與交付的價值一致($5,000 萬的併購交易為 $15K 的 AI 審查提供正當性)
- 不需要持續承諾(進入門檻較低)
- 在證明價值後可以轉為月費合約
定價模型 4:混合型(基礎 + 用量)
運作方式: 客戶支付平台/存取的基礎月費,加上重度使用的按單位費用。
範例:
- 基礎:$2,000/月(包含平台存取、模型託管、標準支援)
- 按審查:每月超過 100 份合約審查後每份 $25
- 大多數客戶停留在基礎層級——按單位定價是對極端使用的保險
適用時機:
- 當你需要防範異常使用模式時
- 當客戶有可變但某種程度上可預測的工作負載時
- 作為對固定費率猶豫不決的客戶的折衷方案