
Vibecoder 的 AI 技術棧:Lovable + n8n + Ertas + Ollama
2026 年想要 AI 驅動應用程式而不按 token 計費的建構者的完整技術棧。用 Lovable 建立,用 n8n 自動化,用 Ertas 微調,用 Ollama 部署。
2025 年,vibecoder 的技術棧很簡單:Cursor + OpenAI API + Vercel。你可以在一個週末發布一個完整的 AI 驅動 SaaS。問題是週一發生的事情——具體來說,當你的 OpenAI 帳單到來,你意識到你的利潤已經蒸發的那個週一。
2026 年,聰明的建構者正在運行不同的技術棧。他們仍然快速發布。他們仍然使用 AI 輔助編碼工具。但他們添加了三個層次,將「有規模化問題的酷炫演示」變成了「有固定成本的盈利產品」。技術棧是:用 Lovable 做前端、用 n8n 做自動化、用 Ertas 做微調、用 Ollama 做推論。讓我們分解為什麼每個層次都存在以及它們如何連接。
2025 技術棧 vs 2026 技術棧
以下是發生了什麼變化以及原因:
| 層次 | 2025 技術棧 | 2026 技術棧 | 為何改變 |
|---|---|---|---|
| 建立 | Cursor / Replit | Lovable / Bolt.new / Cursor | AI 原生應用建構器成熟了 |
| AI 推論 | OpenAI API / Anthropic API | Ollama(本地) | 按 token 成本破壞了利潤 |
| AI 模型 | GPT-4 / Claude(通用) | 微調的 Qwen/Llama(自訂) | 通用模型對窄任務來說是過度殺傷 |
| 模型訓練 | 不適用 | Ertas | 微調對非 ML 開發者變得可及 |
| 自動化 | Zapier / Make | n8n(自托管) | 自托管 = 無按任務費用 + 隱私 |
| 托管 | Vercel / Netlify | Vercel + VPS(Hetzner/DO) | Ollama 推論需要 VPS |
| 5K 用戶的月成本 | API 費用 200-800 美元 | 30-45 美元固定 | 減少 85-95% |
2025 技術棧優化了上線速度。2026 技術棧優化了上線速度和規模化盈利能力。你不必為了一個而犧牲另一個。
第一層:建立——Lovable、Bolt.new 和 Cursor
建立層是你的應用程式成形的地方。在 2026 年,你有三個嚴肅的選擇,而它們不可互換。
Lovable 是當你想要從自然語言描述得到完整部署的網路應用程式時的選擇。你描述你想要什麼,Lovable 生成完整的棧——前端、後端、資料庫、驗證——並部署它。關鍵優勢是速度:你可以在一小時內擁有帶有用戶驗證和資料庫的工作應用程式。代價是你在 Lovable 的架構意見內工作。對大多數 SaaS 應用程式來說,這些意見是可以接受的。
Bolt.new 佔據與 Lovable 類似的空間,但給你更多對技術棧的控制。當你有特定的技術要求時,它更好——特定的資料庫、特定的驗證供應商、你偏好的後端框架。初始建立比 Lovable 稍慢,但對自訂化更靈活。
Cursor 是強大工具。它不是應用程式建構器——它是 AI 驅動的程式碼編輯器。你自己寫(或生成)每一行程式碼,Cursor 的 AI 作為副駕駛。優勢是完全控制。缺點是完全控制需要更多時間。當你在建立架構複雜的東西,或者當你需要顯著偏離標準 SaaS 模式時使用 Cursor。
大多數 vibecoder 的務實選擇: 用 Lovable 或 Bolt.new 進行初始建立,然後用 Cursor 進行自訂化和持續開發。你為 80% 的標準部分獲得了 AI 原生建構器的速度,為 20% 的自訂部分獲得了程式碼編輯器的精確性。
第二層:自動化——n8n
每個 AI 驅動的應用程式都有在幕後發生的工作流程。用戶註冊,發送歡迎電子郵件並建立工作區。用戶上傳文件,用 AI 處理並存儲結果。用戶觸發匯出,生成文件並用電子郵件發送。
2025 年,大多數 vibecoder 使用 Zapier 或 Make 來做這件事。兩者都有效,但在規模化時都有問題:
- Zapier 按任務收費。在每月 5,000 個任務時,你每月支付 73 美元。在每月 50,000 個任務時,是 448 美元。這些成本複合得很快。
- Make 更便宜,但仍然按操作定價。而且兩者都通過第三方伺服器傳送你的資料。
n8n 是 2026 年的答案。它是一個你自托管的開源工作流程自動化工具。優勢:
- 零按任務費用。 每月運行 5,000 或 500,000 個工作流程——成本相同:它運行的每月 5-10 美元的 VPS。
- 資料留在你的基礎設施上。 這對 GDPR、HIPAA 或只是基本的用戶信任很重要。
- 原生 AI 節點。 n8n 有針對 Ollama、OpenAI 和其他 AI 供應商的內建節點。這意味著你的自動化工作流程可以直接呼叫你的本地微調模型。
- 自托管 = 完全控制。 沒有供應商可以棄用你依賴的功能或改變你的定價。
關鍵整合點:n8n 可以直接呼叫你的本地 Ollama 實例。這意味著你的 AI 驅動工作流程(文件處理、內容生成、分類、提取)以零 token 成本在你的微調模型上運行。
典型的 AI 驅動應用程式的 n8n 設置:
用戶操作 → Webhook 觸發 → n8n 工作流程 → Ollama 推論 → 資料庫更新 → 用戶通知
所有這些都在你的基礎設施上運行。每次執行的成本實際上為零。
第三層:微調——Ertas
這是 2025 年對 vibecoder 不存在的層次。微調是 ML 工程師用 PyTorch 腳本和租用 GPU 做的事情。它需要理解訓練迴圈、超參數、資料集格式化和量化。大多數獨立開發者從未費心去做。
Ertas 改變了這一點。以下是非 ML 開發者的微調工作流程:
- 收集你的資料。 記錄你的 AI 功能的輸入和輸出。如果你一直在使用 OpenAI API,你的 API 日誌中已經有這些資料了。將其匯出為 JSONL。
- 上傳到 Ertas。 平台驗證你的資料,標記品質問題,並顯示你的資料集統計。
- 選擇基礎模型。 對大多數應用使用場景,Qwen 2.5 7B 是最佳選擇。足夠大以處理細微任務,足夠小以在每月 30 美元的 VPS 上運行。
- 訓練。 點擊開始。對 500-2,000 個示例進行 LoRA 微調需要 20-60 分鐘。你可以實時觀看損失曲線。
- 評估。 在 Ertas 介面中針對示例輸入測試你的模型。與 GPT-4 回應進行比較。
- 匯出。 以 GGUF 格式下載以供 Ollama 部署。
整個過程,包括資料準備,不到一天。Ertas 每月 14.50 美元,包含無限訓練運行。
為什麼微調對技術棧很重要: 在 Ollama 上本地運行的微調 7B 模型,在你的特定使用場景上將與 GPT-4 相當或更好。不是所有事情——只是你的應用程式實際執行的窄任務。而那是唯一重要的事情。
對於窄任務,「通用前沿模型」和「微調小型模型」之間的性能差距,是 AI 開發中最被低估的事實之一。在你特定任務的 1,000 個示例上訓練的 7B 模型,將在 90-95% 的請求上和 GPT-4 一樣好,成本為零 token。
第四層:部署——Ollama
Ollama 是運行時層。它取你的微調模型(從 Ertas 匯出為 GGUF 檔案)並作為本地 API 提供服務。沒有雲端。沒有 token。沒有按請求計費。
在 VPS 上設置 Ollama 需要五分鐘:
# 安裝 Ollama
curl -fsSL https://ollama.com/install.sh | sh
# 加載你的微調模型
ollama create my-app-model -f Modelfile
# 測試它
curl http://localhost:11434/api/generate -d '{
"model": "my-app-model",
"prompt": "test input",
"stream": false
}'
Ollama 公開了一個與 OpenAI 相容的 API,這意味著在你的應用程式程式碼中從 OpenAI 切換到你的本地模型通常是一行更改——只需更新基礎 URL。
7B 模型的硬體要求:
| VPS 規格 | 供應商 | 月成本 | 性能 |
|---|---|---|---|
| 4 vCPU, 8GB RAM | Hetzner CX32 | 約 14 美元/月 | 10-15 個 token/秒 |
| 4 vCPU, 16GB RAM | Hetzner CX42 | 約 26 美元/月 | 15-25 個 token/秒 |
| 8 vCPU, 16GB RAM | DigitalOcean | 約 48 美元/月 | 20-30 個 token/秒 |
| GPU(RTX 3060) | Vast.ai | 約 30 美元/月 | 40-60 個 token/秒 |
對大多數獨立應用程式,每月 26 美元的 Hetzner VPS 已綽綽有餘。它每秒處理 15-25 個 token,大約可以處理 50-100 個並發 對話而不產生明顯的延遲。
各層如何連接
以下是在這個技術棧上建立的完整 AI 驅動應用程式的架構:
┌─────────────────────────────────────────────┐
│ Lovable / Bolt.new 應用程式(前端 + API) │
│ 托管在 Vercel / Railway │
└──────────────────┬──────────────────────────┘
│
┌──────────┼──────────┐
│ │ │
▼ ▼ ▼
┌─────────┐ ┌──────┐ ┌────────┐
│ 資料庫 │ │ n8n │ │ Ollama │
│(Supabase│ │(自托)│ │(VPS) │
│ /Neon) │ │ │ │ │
└─────────┘ └──┬───┘ └────────┘
│ ▲
└──────────┘
(n8n 呼叫 Ollama
用於 AI 工作流程)
┌─────────────────────────────────┐
│ Ertas(模型訓練/更新) │
│ 匯出 GGUF → Ollama │
└─────────────────────────────────┘
典型 AI 功能的資料流:
- 用戶在你的 Lovable 應用程式中觸發一個操作(例如「總結這個文件」)
- 應用程式將請求發送到你的 Ollama 實例(相同的 VPS 或相鄰的)
- Ollama 在你的微調模型上運行推論
- 回應在 500ms-2s 內返回到應用程式
- 對於非同步工作流程(電子郵件處理、批量操作),n8n 處理協調,根據需要呼叫 Ollama
對於模型更新:
- 每月匯出新的 API 日誌 / 互動資料
- 上傳到 Ertas,重新訓練(20-40 分鐘)
- 匯出更新的 GGUF
- 在你的 Ollama VPS 上熱替換模型(零停機時間滾動更新)
現實世界示例:AI 寫作 SaaS
讓我們把這個變得具體。你在建立 WriteFlow——一個幫助內容創作者重寫段落、生成標題和匹配品牌語調的 AI 寫作助理。以下是每個層次的情況:
第一層(建立): 你使用 Lovable 生成應用程式。描述它:「一個網路應用程式,用戶貼上文字,選擇轉換(重寫、標題、語調匹配),並獲得 AI 生成的結果。包括用戶驗證、過去轉換的歷史,以及用於保存品牌聲音描述的設置頁面。」Lovable 在 45 分鐘內給你一個工作應用程式。
第二層(自動化): 為後台工作流程設置 n8n:
- 新用戶報名 → 發送歡迎電子郵件 + 建立默認品牌聲音設定
- 用戶達到每日限制 → 發送升級提醒電子郵件
- 每週摘要 → 總結每個用戶的使用統計並通過電子郵件發送給他們
第三層(微調): 在你的前 100 個用戶之後,你的資料庫中有 5,000 個以上的重寫示例(輸入文字 → AI 輸出,過濾掉用戶接受結果的情況)。上傳到 Ertas,微調 Qwen 2.5 7B。生成的模型專門擅長你的應用程式提供的三種轉換。
第四層(部署): 匯出 GGUF,部署在每月 26 美元的 Hetzner VPS 上。更新你的 Lovable 應用程式指向 Ollama 端點而不是 OpenAI。
月度成本細分
以下是每個層次在不同規模下的成本:
| 組件 | 100 用戶 | 1,000 用戶 | 5,000 用戶 | 10,000 用戶 |
|---|---|---|---|---|
| Lovable/Vercel 托管 | 0 美元(免費層) | 20 美元/月 | 20 美元/月 | 20 美元/月 |
| 資料庫(Supabase) | 0 美元(免費層) | 25 美元/月 | 25 美元/月 | 25 美元/月 |
| n8n VPS | 6 美元/月 | 6 美元/月 | 12 美元/月 | 12 美元/月 |
| Ollama VPS | 14 美元/月 | 26 美元/月 | 26 美元/月 | 48 美元/月 |
| Ertas | 14.50 美元/月 | 14.50 美元/月 | 14.50 美元/月 | 14.50 美元/月 |
| 合計 | 34.50 美元/月 | 91.50 美元/月 | 97.50 美元/月 | 119.50 美元/月 |
現在將其與依賴 API 的技術棧進行比較:
| 組件 | 100 用戶 | 1,000 用 戶 | 5,000 用戶 | 10,000 用戶 |
|---|---|---|---|---|
| 托管 | 0 美元 | 20 美元/月 | 20 美元/月 | 20 美元/月 |
| 資料庫 | 0 美元 | 25 美元/月 | 25 美元/月 | 25 美元/月 |
| Zapier | 20 美元/月 | 73 美元/月 | 73 美元/月 | 448 美元/月 |
| OpenAI API | 5 美元/月 | 50 美元/月 | 250 美元/月 | 500 美元/月 |
| 合計 | 25 美元/月 | 168 美元/月 | 368 美元/月 | 993 美元/月 |
在 100 個用戶時,2026 技術棧稍微貴一點。在 1,000 個用戶時,它已經更便宜了。在 10,000 個用戶時,你每月節省 873 美元——每年超過 10,000 美元。而且差距只會從那裡擴大,因為 2026 技術棧次線性擴展,而 API 技術棧線性擴展。
在 10,000 個用戶下運行 AI 驅動的 SaaS 的總成本,從近 1,000 美元/月降至低於 120 美元/月。這就是消耗資金的副業專案和盈利業務之間的區別。
本週末開始
你不需要一次採用完整的技術棧。以下是務實的推出方案:
週末一:建立並發布。
- 使用 Lovable 或 Bolt.new 建立你的應用程式
- 使用 OpenAI API 進行 AI 功能(這是驗證你的想法最快的方式)
- 部署到 Vercel
- 發布它。獲得用戶。驗證需求。
週末二:添加自動化。
- 在每月 6 美元的 VPS 上啟動 n8n
- 遷移你的 Zapier/Make 工作流程(或在 n8n 中從頭建立它們)
- 通過 webhook 將 n8n 連接到你的應用程式
週末三:微調你的第一個模型。
- 從你的 OpenAI API 日誌匯出 500 個以上的輸入/輸出對
- 上傳到 Ertas,微調 Qwen 2.5 7B
- 評估結果——確保品質與你的使用場景的 GPT-4 相匹配
週末四:本地化。
- 在 VPS 上部署 Ollama
- 加載你的微調模型
- 在你的應用程式中切換 API 端點
- 取消(或大幅減少)你的 OpenAI API 訂閱
四個週末。每一個都是獨立有價值的——你不需要預先承諾完整的技術棧。但到第四個週末結束時,你擁有一個有固定基礎設施成本、零 token 費用和對 AI 模型完全控制的 AI 驅動應用程式。
這就是 2026 年的 vibecoder 技術棧。快速建立。快速發布。並真正保留收入。
Ship AI that runs on your users' devices.
Ertas early bird pricing starts at $14.50/mo — locked in for life. Plans for builders and agencies.
延伸閱讀
- 你的 Vibe 編碼應用程式達到了 10K 用戶。現在你的 AI 帳單是每月 3,000 美元。 — 深入分析在規模化時擊中 vibe 編碼應用程式的 AI 成本懸崖。
- 獨立應用程式的自托管 AI — 為何自托管 AI 推論是獨立開發者最大的利潤槓桿。
- 在本地運行 AI 模型 — Ollama 和 GGUF 模型的本地推論實用指南。
Ship AI that runs on your users' devices.
Early bird pricing starts at $14.50/mo — locked in for life. Plans for builders and agencies.
Keep reading

The Vibecoder's Exit Strategy: From Platform Lock-In to Full Ownership
You built fast with AI tools and third-party APIs. Now you're locked into platforms you don't control. Here's how to take ownership of your AI stack before it's too late.

MCP + Fine-Tuned Local Model: Connect Claude to Your Domain-Specific AI
Model Context Protocol (MCP) lets Claude Desktop talk to any server — including your own Ollama-hosted fine-tuned model. Here's the architecture and setup for routing Claude requests to a custom domain model.

Claude Desktop + Local Fine-Tuned Model: Complete Setup Guide
Run your fine-tuned model locally, connect it to Claude Desktop via MCP, and get a zero-cost domain AI assistant inside the Claude interface. Full step-by-step setup.