每個主要的 vibe 編碼工具都有同樣的問題。它不在他們的行銷材料中。它在演示過程中不會出現。它在你發布三個月後出現，當你的應用程式有真實用戶，而你的 OpenAI 儀表板看起來像朝錯誤方向的滑雪坡。

這個模式是普遍的：建立階段便宜，規模化階段殘酷。

本指南涵蓋每個主要的 vibecoder 平台——Lovable、Bolt.new、Cursor、Replit、Windsurf、v0 和 Bubble——映射每個平台的成本問題何時出現，並解釋適用於所有平台的修復方法。

普遍的 AI 成本模式

在介紹平台細節之前，這個模式值得解釋，因為它讓大多數建構者感到措手不及。

當你建立你的應用程式時，你是唯一的用戶。你運行 50-100 個測試查詢。OpenAI 帳單是 2-10 美元。感覺還好。你發布了。你獲得了牽引力。在 100 個用戶時，帳單是 15-30 美元。仍然還好。在 500 個用戶時，是 75-150 美元。不舒服但可以管理。在 2,000 個用戶時，是 600-1,200 美元。現在你有了一個真正的問題：你的 AI 功能的成本超過了你所有其他基礎設施棧的總和，而且成本隨用戶線性增長，而收入卻不是。

底層數學：典型的 AI 功能（聊天、摘要、分類、提取）每次請求使用 200-1,000 個 token。以 OpenAI 的定價，那是每次請求 0.0002-0.002 美元。在 2,000 個用戶每月 100 次請求的情況下，你在運行 200,000 次請求，每月 40-400 美元。在 10,000 個用戶時：每月 200-2,000 美元。

這就是成本懸崖。本指南中的每個平台都會產生遇到它的應用程式。

適用於所有平台的修復方案

無論你使用哪個工具建立，解決方案都是相同的：

收集你現有的 AI 互動作為訓練資料（JSONL 格式的輸入→輸出對）
微調一個小型本地模型（7B-14B 參數）使用 Ertas——需要 30-90 分鐘
匯出為 GGUF 並在每月 26 美元的 VPS 上使用 Ollama 在本地運行
更新你的應用程式的 API 端點從 api.openai.com 到你的本地 Ollama 實例

Ollama 與 OpenAI 相容。端點切換通常是程式碼中的一行更改。每月的推論成本變為零 token 費用——只有固定的 VPS 成本。

微調的模型與 GPT-4 的準確率相當或更好，針對你的特定窄用例，因為它是在你的確切任務上訓練的。通用大型語言模型對於大多數窄任務 SaaS 功能來說是過度殺傷。

平台逐一說明

Lovable

Lovable 讓你在幾小時內從提示詞到全棧應用程式。你添加到 Lovable 應用程式的 AI 功能通常是生成的後端程式碼中的 OpenAI API 呼叫。

成本何時出現： Lovable 的速度使得很容易在每個工作流程中添加 AI 功能。更多功能 = 更多 API 呼叫 = 複合成本。Lovable 應用程式每個用戶會話通常有 3-5 個 AI 觸點。

修復方案： 從你的 Lovable 後端日誌匯出 300 個以上的輸入/輸出對，在 Ertas 中微調，運行 Ollama。Lovable 的生成程式碼使用 OpenAI SDK——將 baseURL 更改為指向你的 Ollama 實例。完整指南：Lovable 應用程式 AI 成本問題

盈虧平衡點： 在每月大約 800 個活躍用戶進行 30 次以上 AI 呼叫時。

Bolt.new

Bolt.new 建立的應用程式類似於 Lovable，但對開發者的控制稍多。生成的程式碼通常使用 OpenAI SDK 或直接向 API 的 fetch 呼叫。

成本何時出現： Bolt.new 應用程式的 API 呼叫頻率往往低於 Lovable 應用程式（預設情況下 AI 觸點更少），但有相同的規模化問題。在 1,000 個以上的用戶有任何 AI 功能的情況下，帳單變得有意義。

修復方案： Bolt.new 生成可讀、乾淨的程式碼。找到並替換 OpenAI API 端點很直接。在模型訓練後，遷移到本地 Ollama 端點只需 15-30 分鐘的程式碼更改。完整指南：Bolt.new AI 成本問題

盈虧平衡點： 在約 600-1,000 個月活躍用戶時。

Cursor

Cursor 用戶以比 Lovable/Bolt 用戶更多的程式碼控制建立，所以他們的 AI 整合更有意圖性。但 Cursor 也使得使用它預設建議的 OpenAI SDK 模式添加 AI 功能變得非常容易。

成本何時出現： Cursor 建立的應用程式往往更複雜，AI 通常更深入地嵌入核心工作流程。當 AI 是關鍵功能（而不是錦上添花）時，每個用戶的使用率更高，成本更早出現。

修復方案： 因為 Cursor 應用程式是適當的程式碼庫，遷移是乾淨的。重構 OpenAI 客戶端初始化以指向本地 Ollama 端點。針對你的特定任務微調。完整指南：Cursor 到生產環境不鎖定供應商

盈虧平衡點： 根據功能複雜性差異很大。通常是 500-1,500 MAU。

Replit

Replit 應用程式預設是始終在線的。這引入了一個特定的 AI 成本問題：後台進程、計劃任務和保活機制可能在沒有活躍用戶的情況下進行 API 呼叫。

成本何時出現： 由於始終在線的部署模式，比大多數平台更早。Replit 應用程式甚至在有有意義的用戶流量之前，就可能從後台進程積累 AI 成本。

修復方案： 在修復規模化問題之前，審核你的 Replit 應用程式的後台 AI 呼叫。然後遵循相同的模式：微調、匯出 GGUF、指向外部 Ollama VPS。完整指南：Replit 應用程式 AI 成本

盈虧平衡點： 由於後台呼叫開銷，通常早至 200-400 MAU。

Windsurf

Windsurf（由 Codeium 開發）是一個強大的 AI 輔助程式碼編輯器。用 Windsurf 建立的應用程式遵循標準編碼模式，AI 功能通常通過 OpenAI SDK 或類似工具實現。

成本何時出現： 與 Cursor 相同的模式——使用 Windsurf 建立的應用程式往往更複雜，所以 AI 通常在技術棧中更深，更難提取。但相同的遷移路徑適用。

修復方案： Windsurf 的乾淨程式碼輸出使重構變得直接。API 端點切換與任何 Python/JavaScript 程式碼庫相同。完整指南：Windsurf 微調模型設置

v0 by Vercel

v0 生成部署在 Vercel 上的 React 元件。Vercel AI SDK 是 v0 應用程式中 AI 功能的自然選擇，並且它的設計與 OpenAI 相容。

成本何時出現： Vercel AI SDK 使添加串流 AI 功能變得容易，這往往會增加每個會話的 token 使用量。在規模化時，串流回應比單次呼叫回應更貴。

修復方案： Vercel AI SDK 支援自訂 API 端點。將其指向為你的微調模型提供服務的 Ollama 實例。串流實現保持不變——Ollama 支援相同格式的 SSE 串流。完整指南：v0 AI 成本削減

盈虧平衡點： 典型功能使用時約 700-1,200 MAU。

Bubble

Bubble 是無需程式碼的，所以 AI 整合通過 API 連接器或官方插件進行。Bubble 的 OpenAI 插件在每個工作流程觸發時都會呼叫 API。

成本何時出現： Bubble 工作流程可以頻繁觸發——在頁面加載時、在用戶操作時、在記錄建立時。高頻觸發使 AI 成本快速倍增。

修復方案： Bubble 的 API 連接器可以呼叫任何與 OpenAI 相容的端點，包括在本地運行的 Ollama 實例。這是配置更改，而非程式碼更改。完整指南：Bubble AI 無 API 成本

盈虧平衡點： 根據工作流程觸發頻率，約 400-800 MAU。

平台成本比較

平台	典型 AI 功能使用	成本懸崖開始於	5K 用戶的月成本（API）	5K 用戶的月成本（微調本地）
Lovable	高（多個觸點）	約 500 MAU	400-900 美元	40 美元固定
Bolt.new	中	約 700 MAU	250-600 美元	40 美元固定
Cursor	高（有意圖的功能）	約 400 MAU	400-1,200 美元	40 美元固定
Replit	中 + 後台開銷	約 200 MAU	300-800 美元	40 美元固定
Windsurf	高	約 500 MAU	400-1,000 美元	40 美元固定
v0	中高（串流）	約 700 MAU	350-900 美元	40 美元固定
Bubble	可變（依賴觸發）	約 300-500 MAU	200-700 美元	40 美元固定

週末遷移計劃

無論你的應用程式在哪個平台上，遷移都遵循相同的四個步驟：

步驟一（1-2 小時）：收集訓練資料。 將你的 AI 互動日誌匯出為 JSONL。大多數平台記錄 API 呼叫；你的後端資料庫可能已存儲輸出。目標是 500 個以上的輸入/輸出對。Ertas 驗證你的資料集並告訴你品質是否足夠。

步驟二（包括訓練等待的 2-4 小時）：微調。 上傳到 Ertas，選擇 Qwen 2.5 7B 或 Llama 3.1 8B，配置訓練。訓練需要 30-90 分鐘。針對保留的測試集評估結果。對於特定領域的任務，品質應該與你當前的 API 匹配。

步驟三（1 小時）：部署 Ollama。 啟動一個 Hetzner CX32（每月 14 美元）或 CX42（每月 26 美元）VPS。安裝 Ollama，加載你的 GGUF 檔案。確認與 OpenAI 相容的 API 正在響應。

步驟四（30 分鐘）：更新你的應用程式。 將 API 端點從 api.openai.com 更改為你的 VPS IP。如果需要，更改 API 金鑰（Ollama 預設沒有驗證；如果你的 VPS 是公開的，添加反向代理）。測試。部署。

總活躍時間：4-8 小時。總成本變化：從線性 API 花費到固定基礎設施。

Ship AI that runs on your users' devices.

Ertas early bird pricing starts at $14.50/mo — locked in for life. Plans for builders and agencies.

View early bird pricing or join the waitlist →

Vibecoder AI 成本指南：涵蓋所有主要建構平台（2026）