Vibecoder 的 AI 技術棧：Lovable + n8n + Ertas + Ollama

2025 年，vibecoder 的技術棧很簡單：Cursor + OpenAI API + Vercel。你可以在一個週末發布一個完整的 AI 驅動 SaaS。問題是週一發生的事情——具體來說，當你的 OpenAI 帳單到來，你意識到你的利潤已經蒸發的那個週一。

2026 年，聰明的建構者正在運行不同的技術棧。他們仍然快速發布。他們仍然使用 AI 輔助編碼工具。但他們添加了三個層次，將「有規模化問題的酷炫演示」變成了「有固定成本的盈利產品」。技術棧是：用 Lovable 做前端、用 n8n 做自動化、用 Ertas 做微調、用 Ollama 做推論。讓我們分解為什麼每個層次都存在以及它們如何連接。

2025 技術棧 vs 2026 技術棧

以下是發生了什麼變化以及原因：

層次	2025 技術棧	2026 技術棧	為何改變
建立	Cursor / Replit	Lovable / Bolt.new / Cursor	AI 原生應用建構器成熟了
AI 推論	OpenAI API / Anthropic API	Ollama（本地）	按 token 成本破壞了利潤
AI 模型	GPT-4 / Claude（通用）	微調的 Qwen/Llama（自訂）	通用模型對窄任務來說是過度殺傷
模型訓練	不適用	Ertas	微調對非 ML 開發者變得可及
自動化	Zapier / Make	n8n（自托管）	自托管 = 無按任務費用 + 隱私
托管	Vercel / Netlify	Vercel + VPS（Hetzner/DO）	Ollama 推論需要 VPS
5K 用戶的月成本	API 費用 200-800 美元	30-45 美元固定	減少 85-95%

2025 技術棧優化了上線速度。2026 技術棧優化了上線速度和規模化盈利能力。你不必為了一個而犧牲另一個。

第一層：建立——Lovable、Bolt.new 和 Cursor

建立層是你的應用程式成形的地方。在 2026 年，你有三個嚴肅的選擇，而它們不可互換。

Lovable 是當你想要從自然語言描述得到完整部署的網路應用程式時的選擇。你描述你想要什麼，Lovable 生成完整的棧——前端、後端、資料庫、驗證——並部署它。關鍵優勢是速度：你可以在一小時內擁有帶有用戶驗證和資料庫的工作應用程式。代價是你在 Lovable 的架構意見內工作。對大多數 SaaS 應用程式來說，這些意見是可以接受的。

Bolt.new 佔據與 Lovable 類似的空間，但給你更多對技術棧的控制。當你有特定的技術要求時，它更好——特定的資料庫、特定的驗證供應商、你偏好的後端框架。初始建立比 Lovable 稍慢，但對自訂化更靈活。

Cursor 是強大工具。它不是應用程式建構器——它是 AI 驅動的程式碼編輯器。你自己寫（或生成）每一行程式碼，Cursor 的 AI 作為副駕駛。優勢是完全控制。缺點是完全控制需要更多時間。當你在建立架構複雜的東西，或者當你需要顯著偏離標準 SaaS 模式時使用 Cursor。

大多數 vibecoder 的務實選擇： 用 Lovable 或 Bolt.new 進行初始建立，然後用 Cursor 進行自訂化和持續開發。你為 80% 的標準部分獲得了 AI 原生建構器的速度，為 20% 的自訂部分獲得了程式碼編輯器的精確性。

第二層：自動化——n8n

每個 AI 驅動的應用程式都有在幕後發生的工作流程。用戶註冊，發送歡迎電子郵件並建立工作區。用戶上傳文件，用 AI 處理並存儲結果。用戶觸發匯出，生成文件並用電子郵件發送。

2025 年，大多數 vibecoder 使用 Zapier 或 Make 來做這件事。兩者都有效，但在規模化時都有問題：

Zapier 按任務收費。在每月 5,000 個任務時，你每月支付 73 美元。在每月 50,000 個任務時，是 448 美元。這些成本複合得很快。
Make 更便宜，但仍然按操作定價。而且兩者都通過第三方伺服器傳送你的資料。

n8n 是 2026 年的答案。它是一個你自托管的開源工作流程自動化工具。優勢：

零按任務費用。 每月運行 5,000 或 500,000 個工作流程——成本相同：它運行的每月 5-10 美元的 VPS。
資料留在你的基礎設施上。 這對 GDPR、HIPAA 或只是基本的用戶信任很重要。
原生 AI 節點。 n8n 有針對 Ollama、OpenAI 和其他 AI 供應商的內建節點。這意味著你的自動化工作流程可以直接呼叫你的本地微調模型。
自托管 = 完全控制。 沒有供應商可以棄用你依賴的功能或改變你的定價。

關鍵整合點：n8n 可以直接呼叫你的本地 Ollama 實例。這意味著你的 AI 驅動工作流程（文件處理、內容生成、分類、提取）以零 token 成本在你的微調模型上運行。

典型的 AI 驅動應用程式的 n8n 設置：

用戶操作 → Webhook 觸發 → n8n 工作流程 → Ollama 推論 → 資料庫更新 → 用戶通知

所有這些都在你的基礎設施上運行。每次執行的成本實際上為零。

第三層：微調——Ertas

這是 2025 年對 vibecoder 不存在的層次。微調是 ML 工程師用 PyTorch 腳本和租用 GPU 做的事情。它需要理解訓練迴圈、超參數、資料集格式化和量化。大多數獨立開發者從未費心去做。

Ertas 改變了這一點。以下是非 ML 開發者的微調工作流程：

收集你的資料。 記錄你的 AI 功能的輸入和輸出。如果你一直在使用 OpenAI API，你的 API 日誌中已經有這些資料了。將其匯出為 JSONL。
上傳到 Ertas。 平台驗證你的資料，標記品質問題，並顯示你的資料集統計。
選擇基礎模型。 對大多數應用使用場景，Qwen 2.5 7B 是最佳選擇。足夠大以處理細微任務，足夠小以在每月 30 美元的 VPS 上運行。
訓練。 點擊開始。對 500-2,000 個示例進行 LoRA 微調需要 20-60 分鐘。你可以實時觀看損失曲線。
評估。 在 Ertas 介面中針對示例輸入測試你的模型。與 GPT-4 回應進行比較。
匯出。 以 GGUF 格式下載以供 Ollama 部署。

整個過程，包括資料準備，不到一天。Ertas 每月 14.50 美元，包含無限訓練運行。

為什麼微調對技術棧很重要： 在 Ollama 上本地運行的微調 7B 模型，在你的特定使用場景上將與 GPT-4 相當或更好。不是所有事情——只是你的應用程式實際執行的窄任務。而那是唯一重要的事情。

對於窄任務，「通用前沿模型」和「微調小型模型」之間的性能差距，是 AI 開發中最被低估的事實之一。在你特定任務的 1,000 個示例上訓練的 7B 模型，將在 90-95% 的請求上和 GPT-4 一樣好，成本為零 token。

第四層：部署——Ollama

Ollama 是運行時層。它取你的微調模型（從 Ertas 匯出為 GGUF 檔案）並作為本地 API 提供服務。沒有雲端。沒有 token。沒有按請求計費。

在 VPS 上設置 Ollama 需要五分鐘：

# 安裝 Ollama
curl -fsSL https://ollama.com/install.sh | sh

# 加載你的微調模型
ollama create my-app-model -f Modelfile

# 測試它
curl http://localhost:11434/api/generate -d '{
  "model": "my-app-model",
  "prompt": "test input",
  "stream": false
}'

Ollama 公開了一個與 OpenAI 相容的 API，這意味著在你的應用程式程式碼中從 OpenAI 切換到你的本地模型通常是一行更改——只需更新基礎 URL。

7B 模型的硬體要求：

VPS 規格	供應商	月成本	性能
4 vCPU, 8GB RAM	Hetzner CX32	約 14 美元/月	10-15 個 token/秒
4 vCPU, 16GB RAM	Hetzner CX42	約 26 美元/月	15-25 個 token/秒
8 vCPU, 16GB RAM	DigitalOcean	約 48 美元/月	20-30 個 token/秒
GPU（RTX 3060）	Vast.ai	約 30 美元/月	40-60 個 token/秒

對大多數獨立應用程式，每月 26 美元的 Hetzner VPS 已綽綽有餘。它每秒處理 15-25 個 token，大約可以處理 50-100 個並發對話而不產生明顯的延遲。

各層如何連接

以下是在這個技術棧上建立的完整 AI 驅動應用程式的架構：

┌─────────────────────────────────────────────┐
│  Lovable / Bolt.new 應用程式（前端 + API）    │
│  托管在 Vercel / Railway                     │
└──────────────────┬──────────────────────────┘
                   │
        ┌──────────┼──────────┐
        │          │          │
        ▼          ▼          ▼
   ┌─────────┐ ┌──────┐ ┌────────┐
   │  資料庫  │ │ n8n  │ │ Ollama │
   │（Supabase│ │（自托）│ │（VPS） │
   │  /Neon） │ │      │ │        │
   └─────────┘ └──┬───┘ └────────┘
                   │          ▲
                   └──────────┘
                  （n8n 呼叫 Ollama
                   用於 AI 工作流程）

   ┌─────────────────────────────────┐
   │  Ertas（模型訓練/更新）          │
   │  匯出 GGUF → Ollama             │
   └─────────────────────────────────┘

典型 AI 功能的資料流：

用戶在你的 Lovable 應用程式中觸發一個操作（例如「總結這個文件」）
應用程式將請求發送到你的 Ollama 實例（相同的 VPS 或相鄰的）
Ollama 在你的微調模型上運行推論
回應在 500ms-2s 內返回到應用程式
對於非同步工作流程（電子郵件處理、批量操作），n8n 處理協調，根據需要呼叫 Ollama

對於模型更新：

每月匯出新的 API 日誌 / 互動資料
上傳到 Ertas，重新訓練（20-40 分鐘）
匯出更新的 GGUF
在你的 Ollama VPS 上熱替換模型（零停機時間滾動更新）

現實世界示例：AI 寫作 SaaS

讓我們把這個變得具體。你在建立 WriteFlow——一個幫助內容創作者重寫段落、生成標題和匹配品牌語調的 AI 寫作助理。以下是每個層次的情況：

第一層（建立）： 你使用 Lovable 生成應用程式。描述它：「一個網路應用程式，用戶貼上文字，選擇轉換（重寫、標題、語調匹配），並獲得 AI 生成的結果。包括用戶驗證、過去轉換的歷史，以及用於保存品牌聲音描述的設置頁面。」Lovable 在 45 分鐘內給你一個工作應用程式。

第二層（自動化）： 為後台工作流程設置 n8n：

新用戶報名 → 發送歡迎電子郵件 + 建立默認品牌聲音設定
用戶達到每日限制 → 發送升級提醒電子郵件
每週摘要 → 總結每個用戶的使用統計並通過電子郵件發送給他們

第三層（微調）： 在你的前 100 個用戶之後，你的資料庫中有 5,000 個以上的重寫示例（輸入文字 → AI 輸出，過濾掉用戶接受結果的情況）。上傳到 Ertas，微調 Qwen 2.5 7B。生成的模型專門擅長你的應用程式提供的三種轉換。

第四層（部署）： 匯出 GGUF，部署在每月 26 美元的 Hetzner VPS 上。更新你的 Lovable 應用程式指向 Ollama 端點而不是 OpenAI。

月度成本細分

以下是每個層次在不同規模下的成本：

組件	100 用戶	1,000 用戶	5,000 用戶	10,000 用戶
Lovable/Vercel 托管	0 美元（免費層）	20 美元/月	20 美元/月	20 美元/月
資料庫（Supabase）	0 美元（免費層）	25 美元/月	25 美元/月	25 美元/月
n8n VPS	6 美元/月	6 美元/月	12 美元/月	12 美元/月
Ollama VPS	14 美元/月	26 美元/月	26 美元/月	48 美元/月
Ertas	14.50 美元/月	14.50 美元/月	14.50 美元/月	14.50 美元/月
合計	34.50 美元/月	91.50 美元/月	97.50 美元/月	119.50 美元/月

現在將其與依賴 API 的技術棧進行比較：

組件	100 用戶	1,000 用戶	5,000 用戶	10,000 用戶
托管	0 美元	20 美元/月	20 美元/月	20 美元/月
資料庫	0 美元	25 美元/月	25 美元/月	25 美元/月
Zapier	20 美元/月	73 美元/月	73 美元/月	448 美元/月
OpenAI API	5 美元/月	50 美元/月	250 美元/月	500 美元/月
合計	25 美元/月	168 美元/月	368 美元/月	993 美元/月

在 100 個用戶時，2026 技術棧稍微貴一點。在 1,000 個用戶時，它已經更便宜了。在 10,000 個用戶時，你每月節省 873 美元——每年超過 10,000 美元。而且差距只會從那裡擴大，因為 2026 技術棧次線性擴展，而 API 技術棧線性擴展。

在 10,000 個用戶下運行 AI 驅動的 SaaS 的總成本，從近 1,000 美元/月降至低於 120 美元/月。這就是消耗資金的副業專案和盈利業務之間的區別。

本週末開始

你不需要一次採用完整的技術棧。以下是務實的推出方案：

週末一：建立並發布。

使用 Lovable 或 Bolt.new 建立你的應用程式
使用 OpenAI API 進行 AI 功能（這是驗證你的想法最快的方式）
部署到 Vercel
發布它。獲得用戶。驗證需求。

週末二：添加自動化。

在每月 6 美元的 VPS 上啟動 n8n
遷移你的 Zapier/Make 工作流程（或在 n8n 中從頭建立它們）
通過 webhook 將 n8n 連接到你的應用程式

週末三：微調你的第一個模型。

從你的 OpenAI API 日誌匯出 500 個以上的輸入/輸出對
上傳到 Ertas，微調 Qwen 2.5 7B
評估結果——確保品質與你的使用場景的 GPT-4 相匹配

週末四：本地化。

在 VPS 上部署 Ollama
加載你的微調模型
在你的應用程式中切換 API 端點
取消（或大幅減少）你的 OpenAI API 訂閱

四個週末。每一個都是獨立有價值的——你不需要預先承諾完整的技術棧。但到第四個週末結束時，你擁有一個有固定基礎設施成本、零 token 費用和對 AI 模型完全控制的 AI 驅動應用程式。

這就是 2026 年的 vibecoder 技術棧。快速建立。快速發布。並真正保留收入。

Ship AI that runs on your users' devices.

Free plan with 30 credits/mo, no card required. Paid plans from $25/mo USD.

or view pricing →

Vibecoder 的 AI 技術棧：Lovable + n8n + Ertas + Ollama

2025 技術棧 vs 2026 技術棧

第一層：建立——Lovable、Bolt.new 和 Cursor

第二層：自動化——n8n

第三層：微調——Ertas

第四層：部署——Ollama

各層如何連接

現實世界示例：AI 寫作 SaaS

月度成本細分

本週末開始

延伸閱讀

Ship AI that runs on your users' devices.

Keep reading

Vibecoder 的退出策略：從平台鎖定到完全所有權

Claude Desktop + 本地微調模型：完整設置指南

LangChain + 微調本地模型：無 API 成本的管道構建