Back to blog
    為你的 AI 代理商服務定價:使用自託管模型時的固定費率 vs 按 Token 計費
    pricingagencyself-hostingbusiness-modelsegment:agency

    為你的 AI 代理商服務定價:使用自託管模型時的固定費率 vs 按 Token 計費

    自託管 AI 模型如何改變代理商定價策略。固定費率、按席位和混合定價模型,附帶各 GPU 層級的利潤率範例。

    EErtas Team·

    大多數 AI 代理商從 API 時代繼承了定價模式:根據使用量向客戶收費,以加成方式轉嫁 API 成本。它可以運作,但它限制了你的利潤率並使收入不可預測。

    自託管模型打破了這種動態。你的成本是固定的 GPU 支出,而非按 token 的可變成本。這創造了 API 依賴型代理商無法匹配的定價機會。

    本文延伸了 AI 代理商定價策略指南,為運行自託管微調模型的代理商提供具體的定價模型。

    階梯函數洞察

    API 成本是線性的:更多 token,更多成本。自託管成本是階梯函數:每個 GPU 層級固定成本,該層級內零邊際成本。

    這一個事實改變了你應該如何定價的一切:

    定價模型基於 API 的代理商自託管代理商
    成本結構可變(按 token)固定(按 GPU 層級)
    高使用量客戶的利潤率薄或負值優秀
    收入可預測性
    定價靈活性受 COGS 限制寬利潤率範圍
    客戶偏好不可預測的帳單可預測的預算

    當你的成本是固定的,任何收費超過固定成本的定價模型都會產生利潤。問題不是「我是否負擔得起服務這個客戶?」而是「哪個定價模型最大化我捕捉的價值?」

    定價模型 1:固定月費

    運作方式: 客戶支付固定月費,在定義的範圍內無限使用 AI。

    範例:

    • 律師事務所的合約審查 AI:每月 $5,000 固定
    • 包含:無限合約審查、每月模型重新訓練、支援
    • 你的成本:約 $200/月分攤(GPU 份額、電力、Ertas Studio 席位)
    • 毛利率:96%

    適用時機:

    • 使用量可預測、中等到高的客戶
    • 偏好預算確定性的企業客戶
    • 使用量增長對你有利的合作(客戶使用更多 → 他們獲得更多價值 → 他們停留更久)

    風險:

    • 使用量極端的單一客戶可能使你的 GPU 容量飽和
    • 通過定義「合理使用範圍內的無限」或設定軟上限來緩解

    不同客戶數量的利潤率分析(1 張 RTX 5090,每月 $42 營運成本):

    客戶數營收(每個 $3,000/月)GPU 成本毛利率
    3$9,000$4299.5%
    5$15,000$4299.7%
    10$30,000$4299.9%

    即使以保守定價,一旦 GPU 回本,利潤率也是驚人的。

    定價模型 2:按席位定價

    運作方式: 客戶按有權使用 AI 工具的使用者人數付費。

    範例:

    • AI 驅動的法律研究助理:$200/使用者/月
    • 有 15 位律師的事務所:$3,000/月
    • 你的成本:約 $200/月分攤
    • 毛利率:93%

    適用時機:

    • 使用量隨員工人數增長的產品
    • 以每員工軟體成本思考的客戶
    • 當你希望定價隨客戶成長自然擴展時

    優點:

    • 企業買家熟悉的定價模型(像 SaaS)
    • 當客戶增加使用者時收入自動增長
    • 客戶容易編列預算和核准

    利潤率分析:

    每席位價格10 人事務所50 人事務所200 人事務所
    $100/席位$1,000/月$5,000/月$20,000/月
    $200/席位$2,000/月$10,000/月$40,000/月
    $500/席位$5,000/月$25,000/月$100,000/月

    無論席位數量多少,你的 GPU 成本都相同(直到達到容量限制)。大型事務所的按席位定價利潤極其豐厚。

    定價模型 3:按專案或按合約

    運作方式: 客戶為定義的專案支付固定費用(例如審查特定文件集)。

    範例:

    • 併購交易的盡職調查審查:每筆交易 $15,000
    • 包含:AI 輔助審查最多 5,000 份文件、摘要報告、風險分析
    • 你的成本:2-3 天的代理商時間 + 可忽略的運算成本
    • 毛利率:70-80%(低於月費因為包含人力)

    適用時機:

    • 基於交易的工作(併購、訴訟文件審查)
    • 尚未準備好月度承諾的客戶
    • 輸出明確與業務成果掛鉤的高價值合作

    優點:

    • 定價與交付的價值一致($5,000 萬的併購交易為 $15K 的 AI 審查提供正當性)
    • 不需要持續承諾(進入門檻較低)
    • 在證明價值後可以轉為月費合約

    定價模型 4:混合型(基礎 + 用量)

    運作方式: 客戶支付平台/存取的基礎月費,加上重度使用的按單位費用。

    範例:

    • 基礎:$2,000/月(包含平台存取、模型託管、標準支援)
    • 按審查:每月超過 100 份合約審查後每份 $25
    • 大多數客戶停留在基礎層級——按單位定價是對極端使用的保險

    適用時機:

    • 當你需要防範異常使用模式時
    • 當客戶有可變但某種程度上可預測的工作負載時
    • 作為對固定費率猶豫不決的客戶的折衷方案

    各 GPU 層級的利潤率範例

    層級 1:單張 RTX 5090($2,000 硬體,$42/月營運)

    場景月營收月成本毛利率年利潤
    3 個客戶 × $3,000 固定$9,000$4299.5%$107,496
    5 個客戶 × $2,000 固定$10,000$4299.6%$119,496
    10 個客戶 × $1,500 固定$15,000$4299.7%$179,496

    硬體投資回報:1-2 個月。

    層級 2:雙 RTX 5090($4,000 硬體,$84/月營運)

    場景月營收月成本毛利率年利潤
    10 個客戶 × $3,000 固定$30,000$8499.7%$359,808
    15 個客戶 × $2,000 固定$30,000$8499.7%$359,808
    20 個按席位 $200,平均 10 席位$40,000$8499.8%$479,808

    層級 3:A6000($4,500 硬體,$22/月營運)

    適合需要 48 GB VRAM 的代理商(更大模型,更多並行適配器):

    場景月營收月成本毛利率年利潤
    15 個客戶 × $2,500 固定$37,500$2299.9%$449,736
    5 個企業客戶 × $10,000 固定$50,000$22100.0%$599,736

    注意:這些是運算的毛利率。代理商的總利潤率包含人力、軟體訂閱、管理費用和客戶取得成本。運營良好的代理商的實際淨利率:40-60%。

    受監管產業的定價

    法律醫療保健客戶支付合規溢價。他們不是將你的價格與 ChatGPT 比較——他們是將它與不合規的成本比較(罰款、專業失當風險、聲譽損害)。

    合規溢價指南:

    產業標準 AI 定價含合規溢價
    一般商業$1,500-3,000/月
    法律服務$3,000-8,000/月
    醫療保健$4,000-10,000/月
    金融服務$5,000-12,000/月
    政府/國防$8,000-20,000/月

    合規溢價的正當性在於:

    1. 本地部署需要更多設定和維護
    2. 合規文件和稽核支援增加持續價值
    3. 替代方案(具有合規風險的雲端 AI)對這些客戶實際上不是一個選項
    4. 資料主權保證具有真實、可量化的價值

    定價對話

    向潛在客戶展示定價時:

    以價值而非成本開場。 「這個解決方案每週為你的律師節省 8 小時」比「這個每月要 $5,000」更有力。

    錨定在替代方案上。 「聘請一個 ML 團隊來內部建立這個每年要 $500K。我們的解決方案以每年 $60K 交付相同的成果。」

    讓投資回報顯而易見。 「以每小時 $400 的計費費率,每週節省 8 小時的律師時間 = 每年 $166K 的額外可計費時間。我們 $60K 的年費提供 2.8 倍的回報。」

    提供試點。 「以每月 $X 開始 3 個月的試點。如果到第 3 個月投資回報率不明顯,我們分道揚鑣。」這為客戶的決定降低了風險。


    Ship AI that runs on your users' devices.

    Ertas early bird pricing starts at $14.50/mo — locked in for life. Plans for builders and agencies.

    延伸閱讀

    Ship AI that runs on your users' devices.

    Early bird pricing starts at $14.50/mo — locked in for life. Plans for builders and agencies.

    Keep reading