
你的 Lovable 應用有個每月 $600 的問題
Lovable 讓構建 AI 應用變得輕鬆——直到你的 API 帳單到達。這裡是每位 Lovable 構建者需要看到的費用計算,以及讓 AI 費用在任何規模下保持穩定的解決方案。
你用 Lovable 在一個週末構建了一個 AI 應用。UI 精美,後端已連接,AI 功能感覺神奇。你在 Twitter 上發了演示,獲得了前一百個註冊用戶,並開始收取每月 $9.99。一切感覺都在運作。
然後 OpenAI 的發票到達了。
第一個月 $12。不錯。第二個月 $87——好吧,在成長。第三個月 $620。那比你整個 Stripe 收入還多。突然間,感覺像突破的應用感覺像一個負債。
這個故事正在數千個 Lovable 構建的應用中 上演,這不是 Lovable 的錯。這是 AI 功能定價方式的結構性問題——大多數構建者在帳單到達之前都沒有預見到。
Lovable 做得出色的事(以及它沒有解決的事)
讓我們說清楚:Lovable 確實令人印象深刻。你用自然語言描述你想要的,然後得到一個帶有 Supabase 後端的可工作的 React 應用。身份驗證、資料庫架構、API 路由、UI 元件——Lovable 處理網頁開發的繁瑣部分,讓你專注於產品理念。
對於非傳統開發者的構建者——創辦人、設計師、領域專家——Lovable 消除了發布軟體的最大障礙。甚至有經驗的開發者也使用它來跳過樣板,更快地到達有趣的部分。
但以下是 Lovable 解決的和沒有解決的:
Lovable 處理的:
- 前端產生(React、Tailwind、shadcn)
- 後端腳手架(Supabase、API 路由)
- 身份驗證和使用者管理
- 資料庫設計和查詢
- 部署管道
Lovable 沒有處理的:
- 你的應用在執行時呼叫的每個 AI 功能的費用
- 隨使用者數量線性擴展的 API 定價
- 決定你的 SaaS 是否盈利的利潤率計算
每次使用者在你的 Lovable 應用中觸發 AI 功能——摘要、分類、改寫、推薦——你的應用就會向 OpenAI API 發出請求。Lovable 產生了進行該呼叫的程式碼。但 OpenAI 向你發送帳單。
而那個帳單隨著每一次使用者互動而擴展。
沒有人告訴你的費用計算
讓我們用一個具體的例子來算清楚數字。假設你用 Lovable 構建了一個客戶支援助理——它讀取傳入的訊息、起草回覆並分類票務。相當標準的 AI SaaS。
每次使用者互動涉及大約 1,200 個輸入 token(使用者的訊息加上系統上下文)和 600 個輸出 token(AI 回應)。使用 GPT-4 級定價(每百萬輸入 token $30,每百萬輸出 token $60),以下是你的費用隨成長的情況:
| 每月活躍使用者 | AI 請求/天 | 每月輸入 Token | 每月輸出 Token | 每月 API 費用 |
|---|---|---|---|---|
| 100 | 800 | 2,880 萬 | 1,440 萬 | 約 $1.73 |
| 500 | 4,000 | 1.44 億 | 7,200 萬 | 約 $8.64 |
| 1,000 | 8,000 | 2.88 億 | 1.44 億 | 約 $17.28 |
| 5,000 | 40,000 | 14.4 億 | 7.2 億 | 約 $86.40 |
| 10,000 | 80,000 | 28.8 億 | 14.4 億 | 約 $172.80 |
那個 $1.73 到 $172.80 的曲線看起來可以管理,對吧?問題是:那些是樂觀的數字。在現實世界中,三件事會讓你的費用爆炸:
重度使用者。 你的前 10% 的使用者產生 40-60% 的 AI 請求。一些使用者每天觸發 30 次以上的互動,而不是平均的 8 次。這單獨就能讓你的帳單翻倍。
提示開銷。 你的系統提示、對話歷史和上下文注入為每個請求添加 token。隨著使用者在你的應用中建立歷史,平均 1,200 個 token 的輸入會增加到 2,500-3,500 個。
重試和鏈。 如果你的 AI 功能使用多步驟推理、工具呼叫或驗證迴圈,每個「互動」在幕後實際上可能是 2-4 個 API 呼叫。
以下是現實的費用情況:
| 費用因素 | 金額 |
|---|---|
| 基本 API 費用(8K 使用者,適中使用) | $172/月 |
| 重度使用者乘數(2.2x) | $378/月 |
| 上下文增長 + 提示開銷(1.3x) | $492/月 |
| 重試和鏈開銷(1.25x) | $615/月 |
| 實際每月 AI 支出 | 約 $620/月 |
這就是你的 $12 到 $620 的擴展曲線。從啟動到利潤毀滅三個月。
最糟糕的部分?這個數字只會上升。 如果你幸運地達到 20K 使用者,你的 API 費用看起來會超過 $1,200/月。在 50K 使用者時,超過 $3,000。
為何你的 Lovable 應用多付了錢
根本原因不是 AI 很貴。而是你使用了錯誤的 AI 來做這項工作。
GPT-4 是一個通用模型。它可以寫詩歌、分析法律合約、產生 Python 程式碼、翻譯普通話並解釋量子物理。它是有史以來構建的最有能力的 AI 系統之一。
但你的客戶支援助理不需要這些。它需要:
- 讀取關於你特定產品的客戶訊息
- 將其分類到 8 種票務類型之一
- 使用你公司的語調和範本起草回覆
就這樣。你正在為一個知道一切的模型付費,而你的應用只需要它知道一件事。
這樣想:每次呼叫 GPT-4 的費用相同,無論你是要求它寫小說還是分類支援票。你正在為計算機的工作租用超級計算機。
一個更小的模型——7B 或 8B 參數——在你的特定資料上微調,可以同樣好地處理你的狹窄任務。通常更好,因為它已經在你的應用處理的那種輸入和輸出上訓練過。
而且不是透過 API 每次互動花費 $0.03-$0.09,而是每次互動實際上什麼都不花,因為它在你控制的硬體上執行。
解決方案:在你的應用資料上微調模型
以下是從每月 $620 降到每月 $45 以下的路徑:
1. 匯出你的 API 日誌
你已經向 OpenAI 發送請求幾週或幾個月了。每一個請求都是一個訓練範例。將它們匯出為輸入/輸出對:
- 輸入: 使用者的訊息 + 你的系統提示上下文
- 輸出: AI 的回應,使用者認為有用
你需要大約 200-500 個高品質範例來獲得一個扎實的微調模型。如果你已經運行了幾個月,你可能有數千個。
2. 微調一個小型模型
以基礎模型如 Qwen 2.5 7B 或 Llama 3.3 8B 為基礎,使用 LoRA(低秩適應)在你的資料上訓練。LoRA 不修改整個模型——它訓練一個小型適配器層,為你的任務專業化模型。
這是大多數構建者假設他們需要機器學習團隊的地方。你不需要。稍後會詳細介紹。
3. 匯出為 GGUF 格式
GGUF 是使用 Ollama 和 llama.cpp 等工具在本地端執行模型的標準格式。它針對 CPU 推理進行了優化,這意味著你不需要昂貴的 GPU 伺服器來執行你的模型。
你的微調模型作為單個 GGUF 檔案匯出——對於使用 Q4 量化的 7B 模型,通常為 4-6 GB。
4. 使用 Ollama 部署
在 VPS 上安裝 Ollama,載入你的模型,你就有了一個與 OpenAI API 格式相容的本地 API 端點。你的 Lovable 應用的程式碼幾乎不需要更改——你只需將其指向 http://your-vps:11434 而不是 https://api.openai.com。
沒有每 token 計費。沒有速率限制。沒有第三方資料處理。只是你的模型,執行你的任務,在你的硬體上。
費用比較:API vs. 微調本地端模型
| OpenAI API | 微調本地端模型 | |
|---|---|---|
| 模型 | GPT-4(通用) | 7B 微調(你的用例) |
| 每月 AI 費用 | 約 $620 | $0(本地端執行) |
| 基礎設施 | 包含在 API 定價中 | $30/月 VPS(4 vCPU,16 GB RAM) |
| 微調平台 | N/A | $14.50/月(Ertas) |
| 每 token 費用 | 是,每次請求 | 無 |
| 每月 總費用 | 約 $620/月 | 約 $44.50/月 |
| 20K 使用者時的費用 | 約 $1,240/月 | 仍然約 $44.50/月 |
| 50K 使用者時的費用 | 約 $3,100/月 | 仍然約 $44.50/月 |
關鍵洞察:你的費用保持穩定。 無論你有 5K 還是 50K 個使用者,你都在為 VPS 和微調平台付費。不是每次互動。不是每個 token。每個額外使用者的 AI 請求邊際費用實際上為零。
這就是隨著成長越來越盈利的 SaaS 與越來越不盈利的 SaaS 之間的區別。
Ertas 如何讓這變得容易
「好的,微調聽起來很好。但我使用 Lovable 正是因為我不是工程師。我絕對不知道如何微調模型。」
這正是 Ertas 為之構建的對象。
Ertas 的整個目的是讓微調與使用 Lovable 構建一樣容易。如果你能上傳 CSV,你就能微調模型。
以下是工作流程:
-
上傳你的資料。 將你的 OpenAI API 日誌匯出為 JSONL 檔案(輸入/輸出對)。拖放到 Ertas Studio 中。
-
選擇基礎模型。 從 Qwen 2.5 7B、Llama 3.3 8B 或 Mistral 7B 等模型中選擇。Ertas 根據你的任務類型和資料集大小推薦模型。
-
點擊訓練。 Ertas 處理 LoRA 配置、超參數選擇、訓練迴圈和驗證。你可以實時觀看訓練指標,但不需要理解它們。
-
匯出為 GGUF。 一鍵匯出 Ollama 期望格式的微調模型。下載檔案,準備好部署。
-
部署並迭代。 使用 Ollama 執行你的模型,將你的應用指向它,開始節省。當你收集更多資料並想要改進模型時,上傳新資料並重新訓練。
無需終端命令。無需 Python 筆記本。無需超參數調整。無需 GPU 採購。
Ertas 每月費用 $14.50。加上每月 $30 的 VPS,你的總 AI 基礎設施費用為每月 $44.50——無論你有多少使用者。
品質怎麼樣?
這是每位構建者都會問的問題,也是正確的問題。7B 微調模型是否真的能在你的特定任務上與 GPT-4 相媲美?
答案,令人反直覺的是,是的——而且通常更好。
原因是:GPT-4 試圖在所有事情上都很好。你的微調模型試圖在一件事上很好。對於狹窄、定義良好的任務——分類、擷取、範本化產生、特定領域問答——微調的 7B 模型經常匹配或超過 GPT-4 的效能。
來自真實 Ertas 使用者的一些具體數字:
| 任務類型 | GPT-4 準確率 | 微調 7B 準確率 |
|---|---|---|
| 支援票分類 | 91% | 94% |
| 產品描述產生 | 88%(主觀) | 90%(主觀) |
| 電子郵件分類 | 93% | 95% |
| 從文字提取 JSON | 89% | 96% |
品質差距只出現在需要廣泛世界知識或跨多樣化領域複雜多步驟推理的任務中。對於構成大多數 SaaS 應用中 AI 功能的特定、重複性任務,微調的小型模型是更好的工具。
本週要做什麼
如果你有一個帶有 AI 功能且 API 費用不斷增長的 Lovable 應用,以下是你的行動計劃:
-
查看你的 OpenAI 控制台。 登入 platform.openai.com,查看過去 30 天的使用情況。你的每月支出是多少?趨勢線是什麼?
-
匯出你的 API 日誌。 下載最近的 API 呼叫作為輸入/輸出對。你需要至少 200 個範例,但越多越好。專注於 AI 產生良好輸出的互動。
-
註冊 Ertas。 建立帳戶,上傳你的資料集,並微調模型。整個過程大約需要 30 分鐘的時間(加上在背景執行的訓練時間)。
-
在 VPS 上使用 Ollama 部署。 啟動每月 $30 的 VPS(Hetzner、DigitalOcean 或 Vultr 都可以),安裝 Ollama,並載入你的 GGUF 模型。用幾個真實請求測試它。
-
在你的 Lovable 應用中切換端點。 將 API URL 從 OpenAI 更改為你的 Ollama 實例。由於 Ollama 支援 OpenAI 相容的 API 格式,這通常是一行更改。
你的 Lovable 應用沒有收入問題。它有費用問題。而那個費用問題有一個直接的解決方案。
每月 $14.50 用於 Ertas。每月 $30 用於 VPS。每個 token $0。永遠。
Ship AI that runs on your users' devices.
Ertas early bird pricing starts at $14.50/mo — locked in for life. Plans for builders and agencies.
延伸閱讀
- 你的 Vibe-Coded 應用達到 10K 使用者。現在你的 AI 帳單是每月 $3K。 — Vibe-coded 應用帶有 AI 功能的完整擴展分析。
- 每 token 定價的隱藏費用 — 為何 API 定價模型設計為對你不利地擴展。
- 如何在不撰寫程式碼的情況下微調 AI 模型 — 使用 Ertas 進行微調的逐步指南。
Ship AI that runs on your users' devices.
Early bird pricing starts at $14.50/mo — locked in for life. Plans for builders and agencies.
Keep reading

Bolt.new Apps and the OpenAI Cost Cliff: What Happens at Scale
Bolt.new makes it easy to add AI features. Here's exactly what happens to your OpenAI bill as users grow — and how to replace it with a fine-tuned local model at flat cost.

Replit App AI Costs Exploding? Replace OpenAI with a Fine-Tuned Local Model
Replit's always-on deployment and easy AI integration create a specific API cost problem. Here's how to replace OpenAI with a fine-tuned local model and cut costs to flat rate.

Fine-Tune a Support Bot for Your Lovable App (No API Costs in Production)
Build an AI support bot that actually knows your product — trained on your docs, your tickets, your tone. Then run it locally for zero ongoing API costs.