
你的 Vibe 編碼應用程式達到了 10K 用戶。現在你的 AI 帳單是每月 3,000 美元。
帶有 AI 功能的 vibe 編碼應用程式在規模化時面臨殘酷的成本懸崖。以下是獨立開發者如何通過微調的本地模型將 AI 成本削減 95%——而無需重寫他們的應用程式。
你在一個週末發布了你的應用程式。Cursor 寫了一半的程式碼。Bolt.new 處理了後端。你為「智能」功能接入了 OpenAI API,部署到 Vercel,並在 Twitter 上發布。人們喜歡它。
現在三個月後,你有了 10,000 個月活躍用戶,你的 Stripe 收入正在被一個單行項目吞噬:AI API 成本。
聽起來很熟悉?你並不孤單。
Vibe 編碼熱潮(以及它忘記提到的事情)
我們生活在快速發布的黃金時代。Cursor、Bolt.new、Lovable 和 Replit 等工具使建立 AI 驅動的應用程式變得非常容易。你可以在一個坐姿中從想法到部署產品。不需要計算機科學學位。不需要基礎設施團隊。只需要靈感和一張信用卡。
這確實是驚人的。建立軟體的壁壘從未如此低。
但有一個在「我在 48 小時內發布了這個」階段沒有人談論的陷阱:在發布時花費幾分錢的 AI 功能,在規模化時會花費幾千美元。 在 100 個用戶時感覺不明顯的按 token 定價模式,在 10,000 個用戶時變成了財務懸崖。
規模化懸崖:真實的成本細分
讓我們來具體說明。假設你建立了一個 AI 寫作助理——想想語法建議、語調重寫、智能摘要。非常標準的 vibe 編碼 SaaS。
以下是你在不同用戶數量下的成本情況,假設 GPT-4 級別的定價(每百萬輸入 token 約 30 美元,每百萬輸出 token 約 60 美元)和中等使用率(每個用戶每天觸發約 15 個 AI 請求,平均每次請求 800 個輸入 token 和 400 個輸出 token):
| 月活躍用戶 | 每天的 AI 請求 | 月輸入 token | 月輸出 token | 估計月成本 |
|---|---|---|---|---|
| 100 | 1,500 | 3,600 萬 | 1,800 萬 | 約 2.16 美元 |
| 1,000 | 15,000 | 3.6 億 | 1.8 億 | 約 21.60 美元 |
| 5,000 | 75,000 | 18 億 | 9 億 | 約 108 美元 |
| 8,000 | 120,000 | 28.8 億 | 14.4 億 | 約 173 美元 |
| 10,000 | 150,000 | 36 億 | 18 億 | 約 216 美元 |
等等——每月 216 美元聽起來不那麼糟糕,對吧?那是樂觀的情況。在實踐中,大多數應用程式的情況遠比這糟糕,因為:
- 進階用戶存在。 你的前 10% 的用戶產生 50% 以上的 token。一些用戶每天觸發 50-80 個請求。
- 重試和鏈式調用。 代理式功能、多步驟提示詞和錯誤重試可以使你的 token 數量增加 3-5 倍。
- 上下文視窗增長。 隨著用戶建立歷史記錄,你的提示詞變得更長。那個平均 800 個 token 慢慢爬向 2,000-4,000。
一個有進階用戶和提示詞鏈的 8K MAU 應用程式更真實的情況:
| 成本因素 | 現實估算 |
|---|---|
| 基礎 API 成本(中等使用) | 173 美元/月 |
| 進階用戶倍增器(2.5 倍) | 432 美元/月 |
| 提示詞鏈開銷(1.4 倍) | 605 美元/月 |
| 月 AI 總花費 | 約 600 美元/月 |
如果你收費 9.99 美元/月,那每月 600 美元會活生生吃掉你的利潤。而且隨著你的增長只會更糟。
你為何付出太多:通用模型稅
以下是大多數開發者忽略的事情:你為一個了解一切的模型付費,而你的應用程式只需要它了解一件事。
GPT-4 可以用斯瓦希里語寫詩、解釋量子色動力學,並扮演海盜角色。很酷。但你的寫作助理只需要用英語處理行銷文案的語調調整、語法修正和摘要。
你本質上是在租一輛一級方程式賽車去雜貨店。每一個 API 呼叫都在為你從未使用的所有通用知識付費。
在你的特定使用場景上微調的模型——在實際的用戶互動、你的領域詞彙、你的應用程式預期的輸入和輸出上訓練——可以以較小的尺寸和成本,為你的窄任務提供相同的品質。
解決方案:在你的應用程式資料上微調小型模型
從每月 600 美元到低於 50 美元的路徑看起來是這樣的:
- 匯出你的 API 日誌。 你幾個月來一直在向 OpenAI 發送請求。那些資料是黃金。將其匯出為輸入/輸出對。
- 微調一個小型模型。 取一個 7B 或 13B 參數模型,並使用 LoRA(低秩適應)在你的資料集上訓練它。這不需要博士學位——它需要正確的工具。
- 匯出為 GGUF 格式。 這是使用
llama.cpp和 Ollama 等工具在 CPU 上高效運行模型的標準格式。 - 在本地部署。 在每月 30 美元的 VPS(4 個 vCPU、16GB RAM 對 7B 模型來說已足夠)上運行 Ollama,與你的應用程式一起。沒有 API 呼叫。沒有按 token 計費。只有本地推論。
你的 AI 功能現在在你控制的硬體上運行,使用專門為你的使用場景訓練的模型。
成本比較
讓我們把數字放在一起比較:
| OpenAI API | 微調的本地模型 | |
|---|---|---|
| 模型 | GPT-4(通用目的) | 7B 微調(你的使用場景) |
| 月 AI 成本 | 約 600 美元 | 0 美元(在本地運行) |
| 基礎設施 | 包含在 API 定價中 | 30 美元/月 VPS |
| 微調平台 | — | 14.50 美元/月(Ertas) |
| 按 token 費用 | 是,每次請求 | 無 |
| 月總成本 | 約 600 美元/月 | 約 44.50 美元/月 |
| 20K 用戶的成本 | 約 1,200 美元/月 | 仍然約 44.50 美元/月 |
關鍵是什麼?你的成 本隨著規模化而保持平穩。 無論你有 10K 用戶還是 50K 用戶,你都在為 VPS 和微調平台付費——而不是按 token。
Ertas 如何使其變得可及
「微調聽起來很好,但我不是 ML 工程師。」
這正是重點。Ertas 是為發布應用程式的開發者而建立的,而不是為發論文的人。
- 無需程式碼的微調:上傳你的資料集(CSV、JSONL 或從你的 API 日誌貼上)。選擇基礎模型。點擊訓練。
- 基於 LoRA 的訓練:在消費者硬體上有效的微調。不需要 A100。
- GGUF 匯出:一鍵匯出你的微調模型為 Ollama 期望的格式。
- 為你的工作流程設計:你已經在 vibe 編碼你的應用程式。Ertas 融入了同樣的能量——快速、視覺化、沒有不必要的複雜性。
你不需要了解梯度下降。你需要你的 AI 功能花費更少並且運行更快。
本週你應該做的事情
- 匯出你過去 30 天的 API 日誌(從 OpenAI 或你使用的任何供應商)。將其格式化為輸入/輸出對。
- 報名 Ertas 並上傳你的資料集。在你的資料上微調 7B 模型。
- 匯出 GGUF 模型並在帶有 Ollama 的廉價 VPS 上部署它。
- 將你的應用程式指向 localhost,而不是
api.openai.com。 - 看著你的下一張發票下降 90% 以上。
你的應用程式的 AI 不需要每月花費 600 美元。它可以花費 Ertas 每月 14.50 美元加上 VPS 每月 30 美元——無論你有 10K 用戶還是 100K,這個價格都保持不變。
早鳥定價終身鎖定——永遠沒有按 token 的驚喜。
Ship AI that runs on your users' devices.
Ertas early bird pricing starts at $14.50/mo — locked in for life. Plans for builders and agencies.
延伸閱讀
- 按 token AI 定價的隱藏成本 — 為何 API 定價模型被設計為對你不利的規模化。
- 如何在不寫程式碼的情況下微調 AI 模型 — 使用 Ertas 微調的逐步指南。
- 在本地運行 AI 模型:實用指南 — 關於 Ollama、GGUF 和本地部署你需要了解的一切。
Ship AI that runs on your users' devices.
Early bird pricing starts at $14.50/mo — locked in for life. Plans for builders and agencies.
Keep reading

Your Vibe-Coded App Hit 1,000 Users — Now What?
You shipped fast with Cursor and Bolt. Users love it. But your OpenAI bill just crossed $200/month and it's climbing. Here's the cost survival guide for vibe-coded apps hitting real scale.

The Vibecoder's Guide to AI Unit Economics: When Free Tiers Stop Being Free
OpenAI's free tier got you started. But at scale, you're spending $5K/month on Opus for tasks Haiku could handle. Here's how to think about AI costs like a founder, not a hobbyist.

Building an AI SaaS on $50/Month: The Fine-Tuned Local Stack
You don't need $10K/month in API costs to ship AI features. Here's the complete stack — fine-tuned model, Ollama, $30 VPS — that runs a production AI SaaS for under $50/month.