
Vibecoder的AI技术栈:Lovable + n8n + Ertas + Ollama
2026年完整的构建者技术栈,适用于想要AI驱动应用但无需按Token定价的人。用Lovable构建,用n8n自动化,用Ertas微调,用Ollama部署。
2025年,Vibecoder技术栈很简单:Cursor + OpenAI API + Vercel。你可以在一个周末发布一个完整的AI驱动SaaS。问题是周一发生了什么——具体来说,当你的OpenAI账单到来,你意识到利润已经蒸发的那个周一。
2026年,聪明的构建者在运行不同的技术栈。他们仍然快速发布。他们仍然使用AI辅助编码工具。但他们添加了三层,将"有扩展问题的酷演示「变成」有固定成本的盈利产品"。技术栈是Lovable用于前端,n8n用于自动化,Ertas用于微调,Ollama用于推理。让我们分析每层为什么存在以及它们如何连接。
2025年技术栈 vs 2026年技术栈
以下是变化及原因:
| 层 | 2025年技术栈 | 2026年技术栈 | 变化原因 |
|---|---|---|---|
| 构建 | Cursor / Replit | Lovable / Bolt.new / Cursor | AI原生应用构建器成熟了 |
| AI推理 | OpenAI API / Anthropic API | Ollama(本地) | 按Token成本杀死了利润 |
| AI模型 | GPT-4 / Claude(通用) | 微调Qwen/Llama(自定义) | 通用模型对狭窄任务过度 |
| 模型训练 | 不适用 | Ertas | 微调对非ML开发者变得可及 |
| 自动化 | Zapier / Make | n8n(自托管) | 自托管 = 无按任务费用 + 隐私 |
| 托管 | Vercel / Netlify | Vercel + VPS (Hetzner/DO) | Ollama推理需要VPS |
| 5K用户月成本 | $200-800 API费用 | $30-45固定 | 85-95%降低 |
2025年 技术栈优化了发布速度。2026年技术栈既优化了发布速度又优化了规模化盈利能力。你不必牺牲其中之一。
第1层:构建 — Lovable、Bolt.new和Cursor
构建层是你的应用成型的地方。2026年有三个严肃的选择,它们不可互换。
Lovable是当你想要从自然语言描述获得完整部署Web应用时的选择。你描述你想要的,Lovable生成完整技术栈——前端、后端、数据库、认证——并部署它。关键优势是速度:你可以在不到一小时内拥有带用户认证和数据库的工作应用。权衡是你在Lovable的架构观点内工作。对于大多数SaaS应用,这些观点是可以的。
Bolt.new占据与Lovable类似的空间但给你更多技术栈控制。当你有特定技术要求时更好——特定数据库、特定认证提供商、你偏好的后端框架。初始构建比Lovable稍慢但定制更灵活。
Cursor是强大工具。它不是应用构建器——它是AI驱动的代码编辑器。你自己编写(或生成)每一行代码,Cursor的AI作为副驾驶。优势是完全控制。劣势是完全控制需要更多时间。当你构建架构复杂或需要明显偏离标准SaaS模式的东西时使用Cursor。
大多数Vibecoder的实用选择: 用Lovable或Bolt.new做初始构建,然后用Cursor做定制和持续开发。你获得AI原生构建器在标准80%上的速度,和代码编辑器在自定义20%上的精度。
第2层:自动化 — n8n
每个AI驱动的应用都有幕后的工作流。用户注册,发送欢迎邮件并创建工作空间。用户上传文档,用AI处理并存储结果。用户触发导出,生成文件并发邮件。
2025年,大多数Vibecoder用Zapier或Make做这个。两者都能用,但在规模化时都有问题:
- Zapier按任务收费。5,000个任务/月,你支付$73/月。50,000个任务/月,是$448/月。这些成本快速复合。
- Make更便宜但仍然是按操作定价。两者都将你的数据通过第三方服务器发送。
n8n是2026年的答案。它是一个你自托管的开源工作流自动化工具。优势:
- 零按任务费用。 每月运行5,000或500,000个工作流——相同成本:运行它的$5-10/月VPS。
- 数据留在你的基础设施上 。 这对GDPR、HIPAA或基本用户信任都很重要。
- 原生AI节点。 n8n有内置的Ollama、OpenAI和其他AI提供商节点。这意味着你的自动化工作流可以直接调用本地微调模型。
- 自托管 = 完全控制。 没有供应商可以弃用你依赖的功能或更改定价。
关键集成点:n8n可以直接调用你的本地Ollama实例。这意味着你的AI驱动工作流(文档处理、内容生成、分类、抽取)在你的微调模型上运行,零按Token成本。
典型的AI驱动应用n8n设置:
User action → Webhook trigger → n8n workflow → Ollama inference → Database update → User notification
所有这些在你的基础设施上运行。每次执行成本实际为零。
第3层:微调 — Ertas
这是2025年Vibecoder不存在的层。微调是ML工程师用PyTorch脚本和租用GPU做的事情。它需要理解训练循环、超参数、数据集格式化和量化。大多数独立开发者从不费心。
Ertas改变了这一点。以下是非ML开发者的微调工作流:
- 收集数据。 记录AI功能的输入和输出。如果你一直在使用OpenAI API,你的API日志中已经有这些数据。导出为JSONL。
- 上传到Ertas。 平台验证数据、标记质量问题并显示数据集统计。
- 选择基础模型。 对于大多数应用用例,Qwen 2.5 7B是最佳选择。足够大以处理细微任务,足够小以在$30/月VPS上运行。
- 训练。 点击开始。在500-2,000个示例上的LoRA微调需要20-60分钟。你实时观察损失曲线。
- 评估。 在Ertas界面中用示例输入测试模型。与GPT-4响应比较。
- 导出。 下载为GGUF用于Ollama部署。
整个过程包括数据准备在内不到一天。Ertas每月$14.50,包含无限训练运行。
为什么微调对技术栈很重要: 在Ollama上本地运行的微调7B模型将在你的特定用例上匹配或超越GPT-4。不是所有方面——只是你的应用实际执行的狭窄任务。那才是唯一重要的。
第4层:部署 — Ollama
Ollama是运行时层。它接受你的微调模型(从Ertas导出为GGUF文件)并将其作为本地API提供。没有云。没有Token。没有按请求计费。
在VPS上设置Ollama需要五分钟:
# Install Ollama
curl -fsSL https://ollama.com/install.sh | sh
# Load your fine-tuned model
ollama create my-app-model -f Modelfile
# Test it
curl http://localhost:11434/api/generate -d '{
"model": "my-app-model",
"prompt": "test input",
"stream": false
}'
Ollama暴露OpenAI兼容API,这意味着在应用代码中从OpenAI切换到本地模型通常是一行更改——只需更新基础URL。
7B模型硬件要求:
| VPS规格 | 提供商 | 月成本 | 性能 |
|---|---|---|---|
| 4 vCPU, 8GB RAM | Hetzner CX32 | 约$14/月 | 10-15 token/秒 |
| 4 vCPU, 16GB RAM | Hetzner CX42 | 约$26/月 | 15-25 token/秒 |
| 8 vCPU, 16GB RAM | DigitalOcean | 约$48/月 | 20-30 token/秒 |
| GPU (RTX 3060) | Vast.ai | 约$30/月 | 40-60 token/秒 |
对于大多数独立应用,$26/月的Hetzner VPS绑绑有余。它每秒处理15-25个token,大约支持50-100个并发对话而不会有明显延迟。
各层如何连接
以下是基于此技术栈的完整AI驱动应用架构:
┌─────────────────────────────────────────────┐
│ Lovable / Bolt.new App (Frontend + API) │
│ Hosted on Vercel / Railway │
└──────────────────┬──────────────────────────┘
│
┌──────────┼──────────┐
│ │ │
▼ ▼ ▼
┌─────────┐ ┌──────┐ ┌────────┐
│ Database │ │ n8n │ │ Ollama │
│ (Supabase│ │(self)│ │ (VPS) │
│ /Neon) │ │ │ │ │
└─────────┘ └──┬───┘ └────────┘
│ ▲
└──────────┘
(n8n calls Ollama
for AI workflows)
┌─────────────────────────────────┐
│ Ertas (model training/updates) │
│ Exports GGUF → Ollama │
└─────────────────────────────────┘
月成本分析
以下是每层在不同规模下的成本:
| 组件 | 100用户 | 1,000用户 | 5,000用户 | 10,000用户 |
|---|---|---|---|---|
| Lovable/Vercel托管 | $0(免费层) | $20/月 | $20/月 | $20/月 |
| 数据库(Supabase) | $0(免费层) | $25/月 | $25/月 | $25/月 |
| n8n VPS | $6/月 | $6/月 | $12/月 | $12/月 |
| Ollama VPS | $14/月 | $26/月 | $26/月 | $48/月 |
| Ertas | $14.50/月 | $14.50/月 | $14.50/月 | $14.50/月 |
| 总计 | $34.50/月 | $91.50/月 | $97.50/月 | $119.50/月 |
与API依赖技术栈对比:
| 组件 | 100用户 | 1,000用户 | 5,000用户 | 10,000用户 |
|---|---|---|---|---|
| 托管 | $0 | $20/月 | $20/月 | $20/月 |
| 数据库 | $0 | $25/月 | $25/月 | $25/月 |
| Zapier | $20/月 | $73/月 | $73/月 | $448/月 |
| OpenAI API | $5/月 | $50/月 | $250/月 | $500/月 |
| 总计 | $25/月 | $168/月 | $368/月 | $993/月 |
在100用户时,2026年技术栈稍贵。1,000用户时已经更便宜。10,000用户时,你每月节省**$873**——超过每年**$10,000**。差距只会越来越大,因为2026年技术栈次线性扩展,而API技术栈线性扩展。
Ship AI that runs on your users' devices.
Ertas early bird pricing starts at $14.50/mo — locked in for life. Plans for builders and agencies.
延伸阅读
- 你的Vibe编码应用达到了10K用户。现在你的AI账单是$3K/月。 — 深入了解影响Vibe编码应用的AI成本悬崖。
- 独立应用的自托管AI — 自托管AI推理是独立开发者最大的利润杠杆。
- 本地运行AI模型 — 使用Ollama和GGUF模型进行本地推理的实用指南。
Ship AI that runs on your users' devices.
Early bird pricing starts at $14.50/mo — locked in for life. Plans for builders and agencies.
Keep reading

Your Vibe-Coded App Hit 1,000 Users — Now What?
You shipped fast with Cursor and Bolt. Users love it. But your OpenAI bill just crossed $200/month and it's climbing. Here's the cost survival guide for vibe-coded apps hitting real scale.

From Prototype to Product: Replacing API Calls with Fine-Tuned Models
Your Lovable/Bolt prototype works. Users are signing up. But every API call eats your margin. Here's the step-by-step playbook for migrating from cloud APIs to fine-tuned local models in production.

The Vibecoder's Guide to AI Unit Economics: When Free Tiers Stop Being Free
OpenAI's free tier got you started. But at scale, you're spending $5K/month on Opus for tasks Haiku could handle. Here's how to think about AI costs like a founder, not a hobbyist.