n8nopenaifine-tuningcase-studysegment:builder

我用微调模型替换了 n8n 工作流中的每一个 OpenAI 调用

一位构建者的亲身经历：将 12 个 n8n 工作流从 OpenAI 迁移到本地微调模型。成本、坑点，以及 60 天后的真实结果。

EErtas Team·March 3, 2026

三个月前，我的 n8n 实例运行 12 个工作流，全部调用 OpenAI API。月账单 $487。今天，API 成本为 $0。我的 AI 总支出是 $44.50/月——$30 的 VPS 运行 Ollama 加上 $14.50 的 Ertas。以下是我做了什么、出了什么问题，以及全本地运行 60 天后的惊喜。

迁移前的设置

12 个工作流，~1,355 次/天调用，$487/月 API 成本，以 12% 月增长率增长。

迁移动机

账单增长、速率限制事件导致 3 小时宕机、以及想要拥有自己模型的愿望。

迁移过程

**第 1 周：数据收集。**从 n8n 执行历史导出 3 个月的成功执行并清洗。

**第 2 周：微调。**用 Ertas 微调 3 个模型：Qwen 2.5 7B（分类）、Llama 3.3 8B（提取和生成）。

**第 3 周：测试。**并行测试，微调模型在每项分类和提取任务上都优于 GPT-4o。

**第 4 周：切换。**Hetzner VPS $30.49/月，渐进式迁移。

60 天后的结果

指标	之前	之后
月 AI 支出	$487	$49.99
年 AI 支出	$5,844	$599.88
分类准确率均值	84%	95%
提取准确率均值	77%	92%
平均延迟	1,100ms	185ms
API 宕机次数（60 天）	3	0

最大惊喜

本地实际更快：没有网络往返，分类请求从 800ms 降到 120ms
微调模型更一致：删除了大部分错误处理代码
某些工作流实际上改善了：专注化胜过通用化
资源使用极低：CPU 使用率平均 15-20%

年节省 $5,244。但节省几乎是次要的——更看重的是可靠性和独立性。

Ship AI that runs on your users' devices.

Free plan with 30 credits/mo, no card required. Paid plans from $25/mo USD.

or view pricing →

Ship AI that runs on your users' devices.

Free plan with 30 credits/mo, no card required. Paid plans from $25/mo USD.

or view pricing →

Keep reading

n8n 本地 AI：用你自己的微调模型替换 OpenAI

n8n 本地 AI：用你自己的微调模型替换 OpenAI

分步指南，教你如何将 n8n 工作流中的 OpenAI API 调用替换为本地运行的微调模型。将成本降至零而不牺牲质量。

从每月 $500 的 OpenAI 账单到 $0：将 n8n 工作流迁移到本地模型

从每月 $500 的 OpenAI 账单到 $0：将 n8n 工作流迁移到本地模型

一份面向在 OpenAI API 调用上花费数百美元的 n8n 用户的实用迁移指南。将工作流迁移到本地微调模型，不会破坏任何东西。

n8n + Ollama + 微调模型：零 API 成本自动化技术栈

n8n + Ollama + 微调模型：零 API 成本自动化技术栈

在 n8n 中构建强大的 AI 自动化，每次执行零成本。本指南展示如何通过 Ollama 将每个 OpenAI 节点替换为本地运行的微调模型。