Back to blog
    我用微调模型替换了 n8n 工作流中的每一个 OpenAI 调用
    n8nopenaifine-tuningcase-studysegment:builder

    我用微调模型替换了 n8n 工作流中的每一个 OpenAI 调用

    一位构建者的亲身经历:将 12 个 n8n 工作流从 OpenAI 迁移到本地微调模型。成本、坑点,以及 60 天后的真实结果。

    EErtas Team·

    三个月前,我的 n8n 实例运行 12 个工作流,全部调用 OpenAI API。月账单 $487。今天,API 成本为 $0。我的 AI 总支出是 $44.50/月——$30 的 VPS 运行 Ollama 加上 $14.50 的 Ertas。以下是我做了什么、出了什么问题,以及全本地运行 60 天后的惊喜。

    迁移前的设置

    12 个工作流,~1,355 次/天调用,$487/月 API 成本,以 12% 月增长率增长。

    迁移动机

    账单增长、速率限制事件导致 3 小时宕机、以及想要拥有自己模型的愿望。

    迁移过程

    **第 1 周:数据收集。**从 n8n 执行历史导出 3 个月的成功执行并清洗。

    **第 2 周:微调。**用 Ertas 微调 3 个模型:Qwen 2.5 7B(分类)、Llama 3.3 8B(提取和生成)。

    **第 3 周:测试。**并行测试,微调模型在每项分类和提取任务上都优于 GPT-4o。

    **第 4 周:切换。**Hetzner VPS $30.49/月,渐进式迁移。

    60 天后的结果

    指标之前之后
    月 AI 支出$487$49.99
    年 AI 支出$5,844$599.88
    分类准确率均值84%95%
    提取准确率均值77%92%
    平均延迟1,100ms185ms
    API 宕机次数(60 天)30

    最大惊喜

    • 本地实际更快:没有网络往返,分类请求从 800ms 降到 120ms
    • 微调模型更一致:删除了大部分错误处理代码
    • 某些工作流实际上改善了:专注化胜过通用化
    • 资源使用极低:CPU 使用率平均 15-20%

    年节省 $5,244。但节省几乎是次要的——更看重的是可靠性和独立性。


    Ship AI that runs on your users' devices.

    Ertas early bird pricing starts at $14.50/mo — locked in for life. Plans for builders and agencies.

    Ship AI that runs on your users' devices.

    Early bird pricing starts at $14.50/mo — locked in for life. Plans for builders and agencies.

    Keep reading