
AI 優先 SaaS 的單位經濟學:每個創始人都算錯的利潤率數學
傳統 SaaS 享有 80-90% 的毛利率。AI 優先 SaaS 平均為 25-60%。以下是將盈利的 AI 產品與因推理成本而虧損的產品區分開來的利潤率數學。
傳統 SaaS 有一個簡單、美麗的經濟模型。構建一次,賣給許多人。毛利率 80-90%。每個新客戶的邊際成本接近於零——幾分錢的計算、數據庫中的一行,也許還有一些帶寬。
AI 優先 SaaS 打破了這個模型。每個觸及您的 AI 功能的用戶操作都會產生真實的、可測量的計算成本。您的 COGS 隨使用量線性增長,而不是像傳統基礎設施那樣次線性增長。如果您像傳統 SaaS 一樣定價,同時像計算公司一樣支付費用,您的利潤率比您想象的更薄。
這不是一個理論問題。這是多家資金充裕的 AI 初創公司儘管收入增長強勁卻遭遇盈利壁壘的原因。
傳統 SaaS vs AI SaaS:利潤率差距
服務 10,000 個用戶的傳統 SaaS 產品可能有這樣的成本結構:
| 線項 | 每月費用 |
|---|---|
| 雲端基礎設施(AWS/GCP) | AU$2,000 |
| 數據庫 | AU$500 |
| CDN 和帶寬 | AU$300 |
| 第三方 API(Stripe、電子郵件等) | AU$800 |
| COGS 總計 | AU$3,600 |
在 10,000 個用戶,每個用戶每月 AU$50,這是 AU$500,000 的月收入對 AU$3,600 的可變 COGS——基礎設施端的毛利率為 99.3%。即使考慮到支持和成功成本,您也很容易超過 80%。
現在添加每個用戶都接觸的 AI 功能:
| 線項 | 每月費用 |
|---|---|
| 之前的基礎設施 | AU$3,600 |
| AI API 費用(GPT-4o) | AU$25,000 |
| COGS 總計 | AU$28,600 |
那一個線項將您的基礎設施毛利率從 99.3% 降至 94.3%。仍然沒問題,對嗎?但等等——您有 10,000 個用戶。在 50,000 個用戶時會發生什麼?
| 用戶 | 收入 | 傳統 COGS | AI API 費用 | 總 COGS | 毛利率 |
|---|---|---|---|---|---|
| 10,000 | AU$500K | AU$3,600 | AU$25,000 | AU$28,600 | 94.3% |
| 25,000 | AU$1.25M | AU$6,000 | AU$62,500 | AU$68,500 | 94.5% |
| 50,000 | AU$2.5M | AU$9,000 | AU$125,000 | AU$134,000 | 94.6% |
| 100,000 | AU$5M | AU$15,000 | AU$250,000 | AU$265,000 | 94.7% |
在這種情況下,利潤率保持,因為您每個用戶每月收費 AU$50,AI 成本是每個用戶每月 AU$2.50。這是價格和 AI COGS 之間 20:1 的比率。您沒問題。
但許多 AI 優先產品不在這個位置。AI 不是側面功能——它是核心價值。每個用戶的 AI 成本要高得多。
數學實際上在哪裡崩潰
考慮一個 AI 寫作助手、AI 程式碼審查工具或 AI 研究代理。這些產品之所以存在是因為 AI。用戶大量地與 AI 互動——每天數十或數百次請求,而不是每月。
更典型的 AI 優先成本概況:
| 指標 | 值 |
|---|---|
| 每個用戶每天平均 AI 請求 | 25 |
| 每次請求平均 token | 2,000 |
| 每個用戶每月請求 | 750 |
| 每次請求 GPT-4o 費用 | 約 AU$0.04 |
| 每個用戶每月 AI 費用 | AU$30 |
如果您收取 AU$49/月,您的 AI COGS 僅就是每個用戶 AU$30。這為其他一切留下了 AU$19——基礎設施、支持、銷售、市場營銷、工程師工資和利潤。
AI 部分的毛利率:39%。扣除所有 COGS 後的混合毛利率:可能是 25-35%。
這是風險投資人開始仔細審查 AI 優先 SaaS 的利潤率概況。收入在增長,但利潤率沒有隨著規模擴大,因為 COGS 按比例增長。
五個利潤率陷阱
陷阱 1:按席位定價,同時按 token 付費
您收取固定的月費。您的費用隨使用量增加。重度用戶的費用是輕度用戶的 10-50 倍,但他們都支付相同的費用。按使用量排名前 10% 的用戶可能佔您的 AI 費用的 60%。
陷阱 2:為商品任務使用前沿模型
將分類請求、簡單提取和模板填充發送到 GPT-4o 或 Claude Opus,就像在地面運輸同天到達時隔夜發送包裹一樣。這些任務的輸出品質是相同的。費用高 10-50 倍。
我們見過的一個 SaaS 產品的真實範例:每月在 Claude Opus 上花費 AU$5,200,用於微調的 Qwen 2.5 7B 以相同準確率處理的任務。遷移後,相同的工作負載每月基礎設施費用 AU$80。
陷阱 3:忽略使用倍增器
AI 功能很有粘性。當它們工作良好時,用戶使用更多。在啟動時每個用戶每月平均 10 次使用的功能,一旦用戶將其納入工作流,通常達到每月 30-50 次使用。您基於啟動週使用量的成本預測是錯誤的。
陷阱 4:將 API 費用與總推理成本混淆
API 帳單只是開始。您還需要支付:
- 失敗請求的重試邏輯(2-5% 的請求,取決於提供商)
- 提示工程開銷(更長的系統提示 = 更多輸入 token)
- 評估和監控(影子調用、A/B 測試、品質評分)
- 速率限制緩解(緩衝、排隊、錯誤處理基礎設施)
API 推理的真實總成本通常是原始 API 帳單的 1.2-1.5 倍。
陷阱 5:每個功能沒有成本歸因
大多數團隊知道他們的 AI API 總支出。很少有人知道每個功能的費用。沒有按功能的歸因,您無法識別哪些功能是利潤率正向的,哪些是利潤率負向的。您最終用利潤率正向功能的收入補貼昂貴但使用不多的 AI 功能。
微調模型如何修復利潤率數學
微調模型的經濟學與 API 定價根本不同:
| 費用類型 | 雲端 API | 微調本地模型 |
|---|---|---|
| 每次請求費用 | AU$0.01-0.10 | 約 AU$0 |
| 固定基礎設施 | AU$0 | AU$500-2,000/月 |
| 擴展行為 | 隨使用量線性 | 階梯函數(在閾值升級服務器) |
| 每月 100K 請求的費用 | AU$2,500 | AU$800 |
| 每月 1M 請求的費用 | AU$25,000 | AU$1,500 |
本地推理的階梯函數費用模型使 SaaS 利潤率可行。您的費用不會隨著每個用戶操作增加。它在您需要更大服務器時增加,這在使用量增加 5-10 倍時發生。
在每月 100 萬次請求時,利潤率差異是顯著的:
- API 模型:僅 AI 的 COGS 每月 AU$25,000
- 本地模型:AI 的 COGS 每月 AU$1,500
如果您的產品每個用戶每月收費 AU$49,有 5,000 個用戶(每月 AU$245,000 收入),AI COGS 差異是每月 AU$23,500。那是每年 AU$282,000 回到您的利潤率。
在 AI SaaS 中實現 80%+ 毛利率的路徑
以下是實際有效的利潤率改善路線圖:
第一階段:測量(第 1 個月)
在您的 AI API 支出上實施按功能、按用戶的成本歸因。使用您的 API 提供商的使用日誌,按功能和用戶標記請求,並建立儀表板。您需要知道:
- 每個功能每月的費用
- 每個用戶每月的費用(分佈,不僅僅是平均值)
- 每次請求按任務類型的費用
- 哪些功能是利潤率正向的,哪些是利潤率負向的
第二階段:分類(第 1-2 個月)
將您的 AI 功能分為三類:
- 昂貴模型上的簡單任務 — 立即遷移候選
- 微調可以匹配品質的中等任務 — 中期遷移候選
- 需要前沿推理的真正複雜任務 — 保留在 API 上
大多數 SaaS 產品發現 60-80% 的 AI API 支出屬於第 1 類或第 2 類。
第三階段:微調和遷移(第 2-4 個月)
對於每個第 1 類和第 2 類任務:
- 從您的現有 API 響應匯出訓練資料
- 在任務上微調 7B 或 14B 模型
- 對照保留測試集評估品質
- 在本地部署並將該任務類型路由到本地模型
- 在刪除 API 備用之前監控品質 2 週
第四階段:優化定價(第 4-6 個月)
使用您的新成本結構,重新審視定價:
- 在本地模型上運行的功能具有近乎零的邊際成本——將它們定價入基本訂閱
- 仍在 API 上的功能具有真實的每次使用費用——考慮重度使用的基於使用量的定價或分層限制
- 整體混合利潤率現在應該支持傳統 SaaS 式定價
第五階段:持續改善(持續)
隨著您收集更多生產資料,每季度重新訓練模型。每個訓練週期都提高品質,讓您將更多任務從 API 移至本地。在 6-12 個月內,80/20 的分割變成 90/10。
真實數字:前後對比
這裡有一個來自有 8,000 個用戶的 B2B SaaS 產品的匿名範例:
遷移前(全 API):
- 每月 AI API 費用:AU$18,400
- 收入:AU$312,000
- AI 費用佔收入百分比:5.9%
- 混合毛利率:71%
遷移後(75% 本地,25% API):
- 每月本地推理費用:AU$1,200
- 每月 API 費用:AU$4,600
- 總 AI 費用:AU$5,800
- 收入:AU$312,000
- AI 費用佔收入百分比:1.9%
- 混合毛利率:82%
11 個百分點的利潤率提升轉化為每年額外 AU$151,200 的毛利潤。遷移項目花費了一名工程師 6 週的時間。
投資者的角度
如果您正在為 AI 優先 SaaS 融資,毛利率是知識淵博的投資者首先審查的。他們使用的基準:
- 傳統 SaaS:預期 80-90% 的毛利率
- AI 優先 SaaS(API 依賴):通常 25-60% 的毛利率
- AI 優先 SaaS(模型擁有):可實現 65-85% 的毛利率
「API 依賴」和「模型擁有」之間的差異不僅僅是關於今天的利潤率。而是關於利潤率軌跡。API 依賴產品隨著使用量增長顯示平坦或下降的利潤率。模型擁有產品顯示擴大的利潤率,因為基礎設施費用次線性增長。
了解 AI 經濟學的投資者特別在尋找模型所有權過渡計劃。擁有一個——或者更好,已經執行了它——是融資中的實質性競爭優勢。
這對您的產品決策意味著什麼
利潤率數學應該影響定價上游的產品決策:
- 功能設計: 這個功能可以用定義明確的、狹窄的 AI 任務實現嗎?如果是的話,它是微調候選,可以在固定費率定價中提供。如果它需要開放式的前沿推理,請為每次使用費用做預算。
- 使用限制: 根據您的每次請求實際費用設置 AI 使用限制,而不是任意數字。如果本地推理每次請求費用為 AU$0.001,您可以慷慨。如果 API 推理每次請求費用為 AU$0.05,您需要分層限制。
- 擴展 收入: 具有固定基礎設施費用的 AI 功能是擴展收入機器——更多使用不會讓您花費更多。API 功能則不然。
正確計算利潤率數學的創始人建立了可以盈利擴展的 AI 產品。那些沒有的人最終面臨與董事會的令人不舒服的對話,為什麼收入增長了 3 倍但利潤持平。
Ship AI that runs on your users' devices.
Ertas early bird pricing starts at $14.50/mo — locked in for life. Plans for builders and agencies.
延伸閱讀
- 在您的 SaaS 中構建 AI 功能:何時停止調用 OpenAI API — 從 API 遷移的交叉計算
- SaaS 中 AI 功能定價 — 與您的成本結構一致的定價策略
- 按 token AI 定價的隱藏成本 — 為什麼您的 API 帳單比您想象的更高
Ship AI that runs on your users' devices.
Early bird pricing starts at $14.50/mo — locked in for life. Plans for builders and agencies.
Keep reading

AI Feature Pricing That Actually Works: Subscription, Usage, or Hybrid?
45-50% of AI SaaS will use hybrid pricing by 2028. Here's how to price AI features — subscription, usage-based, or hybrid — so your margins survive as users scale.

SLM-First Architecture: The 80/20 Routing Strategy That Cuts AI Costs 75%
Most AI features don't need GPT-4. An SLM-first architecture routes 80% of requests to fine-tuned local models and 20% to cloud APIs — cutting costs by 60-75% while maintaining quality.

From Prompt Caching to Fine-Tuning: When to Make the Switch
Prompt caching cuts costs 60-90% for repetitive context. Fine-tuning eliminates per-token costs entirely. Here's how to know when you've outgrown caching and should fine-tune instead.