Vibecoder 的 AI 單位經濟學指南：免費層何時不再免費

讓我們談談開始時沒有人解釋的事情：AI 成本的運作方式與普通軟體成本不同。

在普通的 SaaS 中，你的成本大多是固定的。伺服器、資料庫、CDN——它們緩慢且可預測地增長。增加第 1,001 個用戶幾乎不會讓你額外花費任何費用。這就是 SaaS 利潤率達到 80–90% 的原因。

AI 功能把這顛倒過來了。每次用戶互動都要花費真實的錢。每個 API 呼叫都有一個價格標籤。而且定價結構被設計成在你規模小的時候感覺便宜，在你規模大的時候變得昂貴。

免費層讓你起步了。OpenAI 的 5 美元積分涵蓋了你的第一個月的開發。現在你有了用戶，那 5 美元已經變成了 500 美元。然後是 2,000 美元。然後是 5,000 美元。你坐在那裡想知道其他公司如何做到這一點。

以下是他們的方法：他們從第一天起就思考單位經濟學。你現在需要開始思考它們。

免費層的幻覺

每個主要的 AI 供應商都遵循相同的策略：

提供慷慨的免費積分以讓你在他們的平台上建立（5–100 美元的免費 API 積分）
低初始成本感覺微不足道（測試時每月 0.50 美元）
線性成本擴展在大量使用時變得痛苦（1K 用戶時每月 500 美元，10K 時每月 5,000 美元）
無內建成本優化——你必須自己弄清楚

這並不是惡意的。這只是按 token 計費的工作方式。但它創造了一個危險的幻覺：建立原型的成本與運行產品的成本完全不同。

以下是一個真實的場景。你用 Cursor 和 v0 建立了一個 AI 內容工具。在開發期間，你總共在 API 呼叫上花費了大約 8 美元。你的前 50 個測試用戶每月花費你 30 美元。你想：「這完全可以管理。」然後 500 個用戶出現，你每月花費 300 美元。然後 2,000 個用戶，你每月花費 1,200 美元。

曲線看起來是平的。然後它不是了。

單位經濟學的覺醒

如果你想像創辦人而非業餘愛好者那樣思考，你需要三個數字：

1. 每用戶成本（CPU）

月 AI 總花費 ÷ 月活躍用戶 = 每用戶成本

如果你在 API 上每月花費 1,200 美元，有 2,000 MAU，你的每用戶成本是每月 0.60 美元。聽起來很低，直到你意識到你的訂閱價格是 9.99 美元，你的非 AI 基礎設施每個用戶另外花費 0.40 美元。每個用戶的實際利潤是：

9.99 美元（收入）- 0.60 美元（AI）- 0.40 美元（基礎設施）- 2.00 美元（Stripe 費用 + 支付處理）= 6.99 美元利潤

不錯？等等——你只有 12% 的用戶在付費。所以你每個 MAU 的有效收入是 1.20 美元。你每個 MAU 的成本是 1.00 美元。你的利潤是每個用戶 0.20 美元。二十分錢。

以那個利潤率，你需要 50,000 MAU 才能每月賺 10,000 美元。而且你的 AI 成本隨用戶線性擴展，所以利潤率不會隨著增長而改善。它實際上可能會變得更糟。

2. 每次 AI 互動成本

每個 AI 功能呼叫花費你多少？按功能細分：

功能	使用的模型	平均 token	每次呼叫成本	每天呼叫次數	每天成本
智能回覆建議	GPT-4o	1,800	0.012 美元	6,000	72 美元
內容摘要	GPT-4o	2,400	0.018 美元	2,200	39.60 美元
語法檢查	GPT-4o	800	0.006 美元	8,000	48 美元
風格分析	Claude Opus	3,000	0.075 美元	400	30 美元
合計					189.60 美元/天

看那個表格。你在使用 GPT-4o 進行語法檢查。這就像僱用律師來校對你的短信。而每天 400 次呼叫的 Claude Opus 用於風格分析，每月在一個功能上花費 900 美元。

3. 每個功能成本

哪些功能值得其 AI 成本？將收入影響與 AI 成本進行對比：

智能回覆：用戶將其列為訂閱的第一原因。高價值，高成本。值得優化但不應削減。
語法檢查：基本功能。用戶期望它存在。但在 GPT-4o 上每月花費 1,440 美元用於基本語法？那是一個微調 3B 模型的任務。
風格分析：被 8% 的用戶使用。每月花費 900 美元。它是否推動了訂閱？如果沒有，這是你在補貼的功能。

模型層次策略

以下是將你的 AI 成本從曲棍球棒形狀變成合理項目的框架：

第一層：微調的本地模型（80% 的請求）

這些處理日常工作。分類、提取、格式化、簡單生成、語法檢查——任何任務定義明確、你有良好輸出示例的東西。

成本：固定（VPS 每月 30–80 美元）
模型：Phi-4 3.8B、Qwen 2.5 7B、Llama 3.3 8B（在你的資料上微調）
何時使用：重複性任務、結構化輸出、特定領域的分類

在上面的示例中，語法檢查和內容分類移到這裡。這立即從 API 中移走了每天 14,000 次呼叫。

第二層：中級 API 模型（15% 的請求）

對於需要比 7B 模型更多能力但不需要前沿推理的任務。GPT-4o-mini、Claude Haiku 3.5 或 Gemini Flash。

成本：每百萬輸入 token 0.15–0.60 美元（比前沿模型便宜 10–40 倍）
何時使用：中等複雜度的生成、更長的內容、不需要前沿推理的多步驟任務

智能回覆建議和摘要可能在這裡——或者在微調後移到第一層。

第三層：前沿模型（5% 的請求）

GPT-4o、Claude Opus、Gemini Pro。保留給真正需要大型模型的事情。

成本：每百萬輸入 token 2.50–15 美元
何時使用：複雜推理、創意生成、模糊任務、任何品質下降會立即明顯的事情

風格分析留在這裡——但只有複雜的案例。簡單的風格檢查移到第一層。

應用層次：前後對比

使用我們的示例應用程式：

之前（所有內容都在前沿模型上）：

功能	月成本
智能回覆（GPT-4o）	2,160 美元
摘要（GPT-4o）	1,188 美元
語法（GPT-4o）	1,440 美元
風格分析（Opus）	900 美元
合計	5,688 美元/月

之後（分層方法）：

功能	層次	月成本
語法（微調的 Phi-4，本地）	1	約 0 美元（包含在 VPS 中）
智能回覆（微調的 Llama 8B，本地）	1	約 0 美元（包含在 VPS 中）
摘要（Haiku 3.5）	2	59 美元
風格分析（Opus，減少流量）	3	180 美元
VPS（32GB，Hetzner）	—	50 美元
Ertas（Builder 方案）	—	14.50 美元
合計		303.50 美元/月

從 5,688 美元到 303.50 美元。降低了 94.7%。而且用戶體驗是相同的——或者更好，因為本地模型回應更快。

微調何時成為明顯的財務舉措

以下是微調的盈虧平衡數學：

微調的一次性成本：時間投入（一個週末）+ Ertas 訂閱（14.50 美元/月）+ VPS（30–80 美元/月）。

月節省：取決於你遷移了多少 API 呼叫。但假設你目前每月在 API 上花費 500 美元用於一個微調模型可以處理的功能。

盈虧平衡：第一個月。你第一個月的節省（500 美元 - 44.50 美元 = 455.50 美元）超過了微調的成本。沒有回收期。它立即是正的。

問題不是「微調什麼時候在財務上有意義？」而是「我還沒做它浪費了多少錢？」

對大多數獨立應用程式來說，答案是：微調在你每月為單個定義明確的功能在 API 呼叫上花費超過 100 美元時就有意義了。那通常是在 500 到 2,000 MAU 之間的某個地方。

如何計算你真實的每用戶成本

以下是你現在應該運行的快速公式：

從上個月提取你的 API 總花費
加上你的基礎設施成本（托管、資料庫、CDN）
加上你的工具訂閱（Ertas、分析、監控）
除以你的 MAU

那是你真實的每用戶成本。現在將其與你的每用戶收入（總收入 ÷ 總用戶，包括免費用戶）進行比較。

如果每用戶成本 > 每用戶收入，你在每個用戶身上都在燒錢。如果每用戶收入低於每用戶成本的 3 倍，你的利潤率太薄，無法建立真正的業務。

解決方案幾乎總是相同的：停止使用前沿模型進行例行任務。微調。分層你的模型。將可變成本轉化為固定成本。

停止像業餘愛好者那樣思考

業餘愛好者和創辦人之間的差異不在程式碼上。在於理解收入減去成本等於生存。

你的 AI 成本不是固定的稅。它們是你可以控制的變數。建立可持續業務的 vibecoder 是那些學會像思考用戶體驗一樣思考每次互動成本的人——作為一個值得關注和優化的核心指標。

免費層讓你來到了這裡。理解單位經濟學讓你進入下一個層次。

Ship AI that runs on your users' devices.

Ertas early bird pricing starts at $14.50/mo — locked in for life. Plans for builders and agencies.

View early bird pricing or join the waitlist →