
我用微调模型替换了 n8n 工作流中的每一个 OpenAI 调用
一位构建者的亲身经历:将 12 个 n8n 工作流从 OpenAI 迁移到本地微调模型。成本、坑点,以及 60 天后的真实结果。
三个月前,我的 n8n 实例运行 12 个工作流,全部调用 OpenAI API。月账单 $487。今天,API 成本为 $0。我的 AI 总支出是 $44.50/月——$30 的 VPS 运行 Ollama 加上 $14.50 的 Ertas。以下是我做了什么、出了什么问题,以及全本地运行 60 天后的惊喜。
迁移前的设置
12 个工 作流,~1,355 次/天调用,$487/月 API 成本,以 12% 月增长率增长。
迁移动机
账单增长、速率限制事件导致 3 小时宕机、以及想要拥有自己模型的愿望。
迁移过程
**第 1 周:数据收集。**从 n8n 执行历史导出 3 个月的成功执行并清洗。
**第 2 周:微调。**用 Ertas 微调 3 个模型:Qwen 2.5 7B(分类)、Llama 3.3 8B(提取和生成)。
**第 3 周:测试。**并行测试,微调模型在每项分类和提取任务上都优于 GPT-4o。
**第 4 周:切换。**Hetzner VPS $30.49/月,渐进式迁移。
60 天后的结果
| 指标 | 之前 | 之后 |
|---|---|---|
| 月 AI 支出 | $487 | $49.99 |
| 年 AI 支出 | $5,844 | $599.88 |
| 分类准确率均值 | 84% | 95% |
| 提取准确率均值 | 77% | 92% |
| 平均延迟 | 1,100ms | 185ms |
| API 宕机次数(60 天) | 3 | 0 |
最大惊喜
- 本地实际更快:没有网络往返,分类请求从 800ms 降到 120ms
- 微调模型更一致:删除了大部分错误处理代码
- 某些工作流实际上改善了:专注化胜过通用化
- 资源使用极低:CPU 使用率平均 15-20%
年节省 $5,244。但节省几乎是次要的——更看重的是可靠性和独立性。
Ship AI that runs on your users' devices.
Ertas early bird pricing starts at $14.50/mo — locked in for life. Plans for builders and agencies.
Ship AI that runs on your users' devices.
Early bird pricing starts at $14.50/mo — locked in for life. Plans for builders and agencies.
Keep reading

n8n Local AI: Replace OpenAI With Your Own Fine-Tuned Model
Step-by-step guide to replacing OpenAI API calls in your n8n workflows with a locally-running fine-tuned model. Cut costs to zero without sacrificing quality.

From $500/Month OpenAI Bills to $0: Migrating n8n Workflows to Local Models
A practical migration guide for n8n users spending hundreds on OpenAI API calls. Move your workflows to local fine-tuned models without breaking anything.

n8n + Ollama + Fine-Tuned Models: The Zero-API-Cost Automation Stack
Build powerful AI automations in n8n that cost nothing per execution. This guide shows you how to replace every OpenAI node with a locally-running fine-tuned model via Ollama.