
Bubble 無代碼應用程式 + 本地 AI:在沒有 API 費用的情況下發布 AI 功能
Bubble 的 OpenAI 插件和 API 連接器會在規模化時產生按 token 計費的費用。以下是如何使用 Ollama 的 OpenAI 相容 API 用微調本地模型替換它們。
Bubble 是構建嚴肅無代碼應用程式的地方。多邊市場、複雜的 SaaS 工具、工作流自動化產品——Bubble 全都能處理。當您在 Bubble 應用程式中添加 AI 功能時,您通常使用 OpenAI 插件或自定義 API 連接器來調用 Claude 或 GPT-4。
這些都能用。問題在於它們在規模化時的費用——而 Bubble 應用程式在規模化時可能 比您預期的更快遇到這個問題,因為 Bubble 工作流是由事件觸發的,而不僅僅是用戶操作。
Bubble 應用程式目前如何使用 AI
Bubble 中有三種常見的 AI 使用模式:
OpenAI 插件 是最簡單的入門方式。安裝它,輸入您的 API 密鑰,您就可以從任何 Bubble 工作流中調用 GPT 模型。每次插件調用都是一個直接的 OpenAI API 請求,按 token 計費。
API 連接器 讓您從 Bubble 工作流中調用任何 REST API。需要更多控制(自定義標頭、特定模型、串流)的構建者會直接設置 OpenAI 或 Anthropic API 的連接器。仍然按 token 計費。
後端工作流觸發器 是 Bubble 的 AI 成本變得不透明的地方。Bubble 工作流在以下情況觸發:新記錄創建、定時觸發、用戶操作、webhook 接收、數據庫變更。如果這些觸發器中的任何一個引發了 AI 調用,成本會根據觸發頻率而非僅用戶會話數量累積。
Bubble AI 成本問題
一個真實世界的例子:一個 Bubble CRM 應用程式,當新潛在客戶創建時使用 AI 自動生成跟進電子郵件草稿。工作流在「新潛在客戶已創建」時觸發,並調用 OpenAI 生成草稿。
每天 50 個新潛在客戶:50 次調用 × 700 個 token = 35,000 個 token/天 = 1,050,000 個 token/月 = 約每月 2-20 美元(費用取決於模型)。
業務擴展到每天 500 個潛在客戶:每月 20-200 美元。擴展到每天 5,000 個:每月 200-2,000 美元。
現在添加第二個 AI 工作流(潛在客戶進入時的資格評分)、第三個(添加備注時的會議摘要生成)和第四個(每週報告生成)。每一個都使成本倍增。
| 工作流數量 | 每日觸發次數 | 每月費用(gpt-4o-mini) | 每月費用(gpt-4o) |
|---|---|---|---|
| 1 個 AI 工作流,50 次觸發 | 50 | 約 2 美元 | 約 30 美元 |
| 1 個 AI 工作流,500 次觸發 | 500 | 約 20 美元 | 約 300 美元 |
| 4 個 AI 工作流,500 次觸發 | 2,000 | 約 80 美元 | 約 1,200 美元 |
| 4 個 AI 工作流,5,000 次觸發 | 20,000 | 約 800 美元 | 約 12,000 美元 |
為什麼 Bubble 構建者有優勢
以下是 Bubble 特有的好消息:您的應用程式已經在調用外部 API。從 OpenAI 的 API 切換到本地模型的 API 是一個配置更改,而非架構更改。
Bubble 的 API 連接器是通用的——它調用您配置的任何 REST 端點。Ollama(提供您的微調 GGUF 模型的工具)公開了一個 OpenAI 相容的 REST API。您的 Bubble AI 調用可以通過在 API 連接器設置中更新一個 URL,從 api.openai.com 重定向到您的 Ollama VPS。
無 需更改代碼。無需重建工作流。只需更換一個 URL。
架構:Bubble → OpenAI 相容的本地 API
Bubble 工作流
↓(API 連接器調用)
您的 VPS(例如 Hetzner,14-26 美元/月)
└── Ollama(提供微調的 GGUF)
└── OpenAI 相容端點:http://your-vps:11434/v1
↓(回應)
Bubble 繼續使用 AI 輸出的工作流
在 Bubble 中設置 Ollama API 連接器
-
在 Bubble 中創建 API 連接器:
- API 根 URL:
http://your-vps-ip:11434 - 添加新 API:「LocalAI」
- API 根 URL:
-
添加聊天完成調用:
- 方法:POST
- 路徑:
/v1/chat/completions - 標頭:
Content-Type: application/json - 正文(JSON):
{ "model": "your-fine-tuned-model", "messages": [ {"role": "system", "content": "您的系統提示"}, {"role": "user", "content": "<dynamic_input>"} ], "temperature": 0.1 } -
映射回應:
- 提取:
choices[0].message.content
- 提取:
這與 OpenAI API 的結構相同。如果您在 Bubble 中已有 OpenAI 連接器,您只需複製它並更改 URL——10-15 分鐘的工作。
為 Bubble 用例進行微調
Bubble 應用程式通常將 AI 用於以下任務——這些都是絕佳的微調候選項:
分類和評分: 潛在客戶資格評定、工單路由、內容審核、情感分類。這些是最高 ROI 的微調任務:在 400 個標注示例上訓練的 7B 模型可達到 90-94% 的準確率,每次分類的邊際成本為零。
帶模板的內容生成: 跟進電子郵件、會議摘要、報告生成、產品描述。微調捕捉您的特定格式、語氣和領域詞彙。相比通用提示,輸出一致性大幅提升。
數據提取: 從非結構化文本輸入(聯繫表單、支援電子郵件、文件上傳)中提取結構化數據。在(輸入、JSON 輸出)對上微調可產生高度一致的結構化提取。
文字轉換: 摘要、重新格式化、領域內翻譯。對於具有一致輸入/輸出模式的任務,微調模型的品質可以媲美 GPT-4。
逐步遷移
步驟 1:識別您成本最高的 AI 工作流。 查看您的 OpenAI 使用量儀表板。哪個工作流產生最多 token?那就是您第一個遷移的候選。
步驟 2:從 Bubble 的數據庫匯出訓練數據。 您的 AI 輸出很可能存儲在您的 Bubble 數據庫中(或應該存儲)。以 CSV 匯出 400-800 個輸入/輸出對,轉換為 JSONL:
{"instruction": "為此潛在客戶生成跟進電子郵件:", "input": "姓名:John Smith,公司:Acme,詢問:企業計劃定價", "output": "嗨 John,感謝您對我們企業計劃的興趣..."}
步驟 3:在 Ertas 中微調。 上傳 JSONL,選擇基礎模型(Qwen 2.5 7B 適合大多數 Bubble 用例),訓練,匯出 GGUF。
步驟 4:在 VPS 上部署 Ollama。 Hetzner CX32(14 美元/月)可以處理針對 Bubble 典型工作流模式(短輸入、結構化輸出)微調的 7B 模型。加載您的 GGUF 文件,啟動 Ollama。
步驟 5:更新 Bubble API 連接器。 更改 API 根 URL。用示例工作流測試。部署。
遷移後的成本
| 每日 AI 觸發次數 | 每月費用(gpt-4o-mini) | 每月費用(本地微調模型) |
|---|---|---|
| 500 | 約 20 美元 | 40.50 美元 |
| 2,000 | 約 80 美元 | 40.50 美元 |
| 10,000 | 約 400 美元 | 40.50 美元 |
| 50,000 | 約 2,000 美元 | 40.50-66.50 美元 |
與 gpt-4o-mini 相比的盈虧平衡:約每天 2,000-2,500 次觸發。與 gpt-4o 相比:低於每天 200 次觸發。
延伸閱讀
- Vibecoder AI 成本指南:所有平台 — 每個主要平台的成本懸崖
- Make.com + 本地 AI — Make.com 自動化工作流的相同方法
- n8n + Ollama 微調零成本堆疊 — 帶本地模型的自托管自動化
- 無代碼微調 AI — Ertas 訓練工作流的運作方式
- 本地運行 AI 模型 — 在 VPS 上設置 Ollama
Ship AI that runs on your users' devices.
Early bird pricing starts at $14.50/mo — locked in for life. Plans for builders and agencies.
Keep reading

v0 App AI Features at Flat Cost — No Per-Token Pricing
v0 by Vercel makes AI features easy with the Vercel AI SDK. Here's how to replace per-token cloud API costs with a fine-tuned local model at flat monthly cost.

MCP Servers + Local Models: Zero API Costs for Domain-Specific AI Tools
The combination of MCP servers and fine-tuned local models eliminates per-token costs for AI tools built on Claude, Cursor, and other MCP-compatible clients. Here's the cost math and the architecture.

Replit App AI Costs Exploding? Replace OpenAI with a Fine-Tuned Local Model
Replit's always-on deployment and easy AI integration create a specific API cost problem. Here's how to replace OpenAI with a fine-tuned local model and cut costs to flat rate.