
從每月 $500 的 OpenAI 帳單到 $0:將 n8n 工作流程遷移到本地模型
為每月花費數百美元於 OpenAI API 呼叫的 n8n 用戶提供的實用遷移指南。在不破壞任何東西的情況下將工作流程遷移到本地微調模型。
你從一個使用 OpenAI 的 n8n 工作流程開始。一個簡單的——也許它分類傳入的電子郵件或從表單提交中提取資料。API 呼叫每次執行的費用不到一分錢。幾乎不引人注意。所以你又構建了五個工作流程。然後十個。然後你為需要更好推理的工作流程添加了 GPT-4。然後你的同事看到了你構建的東西,又要求了三個。
現在你面對的是每月 $500 的 OpenAI 帳單。而且還在增長。
問題是:大多數這些工作流程不需要 GPT-4。它們甚至不需要 GPT-3.5。它們需要一個在一個特定任務上非常出色的模型——分類、提取、重新格式化、摘要——而這正是微調的 7B 模型所做的。從 OpenAI API 呼叫遷移到本地微調模型並不像聽起來那麼可怕,節省的成本是巨大的:從每月數百美元到按每個 token 計費字面上為零。
本指南逐步介紹整個遷移過程。我們將稽核你的工作流程、優先考慮遷移內容、為每種工作流程類型微調模型、使用 Ollama 部署它們,並在不破壞任何東西的情況下在 n8n 中交換端點。
遷移稽核
在遷移任何東西之前,你需要了解你在處理什麼。稽核的目標是清點每個使用 AI 節點的 n8n 工作流程,按複雜性和容量對每個進行分類,並確定快速獲勝的機會。
第一步:列出所有帶有 AI 節點的工作流程。 在 n8n 中,進入你的工作流程列表並搜索包含 OpenAI 節點(或任何 AI/LLM 節點)的工作流程。對於每個工作流程,記錄:
- 工作流程名稱和目的
- 使用的模型(GPT-4、GPT-4o、GPT-3.5-turbo)
- 每天的大約執行次數
- 每次執行的平均輸 入 token 數
- 每次執行的平均輸出 token 數
- 是否使用結構化輸出(JSON 模式、函數呼叫)
第二步:按任務類型分類。 大多數 AI 驅動的 n8n 工作流程屬於以下類別:
| 任務類型 | 範例 | 複雜性 | 遷移難度 |
|---|---|---|---|
| 分類 | 電子郵件路由、票券分類、情感分析 | 低 | 簡單 |
| 提取 | 從文字中提取名稱/日期/金額、解析發票 | 低-中 | 簡單 |
| 重新格式化 | 將散文轉換為要點、標準化格式 | 低 | 簡單 |
| 摘要 | 摘要電子郵件、會議記錄、文件 | 中 | 中等 |
| 生成 | 撰寫電子郵件回覆、創建描述、起草內容 | 中-高 | 中等 |
| 推理 | 多步驟分析、決策制定、複雜問答 | 高 | 困難 |
| 代碼生成 | 撰寫 SQL 查詢、生成腳本 | 高 | 困難 |
第三步:計算每個工作流程的費用。 將每個工作流程的每日執行次數乘以其 token 使用量和模型的每個 token 費率。以下是快速參考:
| 模型 | 輸入費用(每 100 萬 token) | 輸出費用(每 100 萬 token) |
|---|---|---|
| GPT-4o | $2.50 | $10.00 |
| GPT-4 | $30.00 | $60.00 |
| GPT-3.5-turbo | $0.50 | $1.50 |
每天運行 500 次、800 個輸入 token 和 200 個輸出 token 的 GPT-4o 工作流程:
- 輸入:500 x 800 = 40 萬 token/天 = 1,200 萬 token/月 = $30/月
- 輸出:500 x 200 = 10 萬 token/天 = 300 萬 token/月 = $30/月
- 總計:單個工作流程每月 $60
乘以 10-15 個工作流程,你就能明白為什麼每月 $500 很快就發生了。