
SaaS 何时应该从 API 调用升级到微调
你的 AI 功能有效。你的 API 账单增长速度超过了收入。以下是从按 token API 迁移到微调模型的决策框架、成本计算和迁移路径——每一步都有真实数据。
你的 SaaS 找到了产品市场契合点。AI 功能正在推动用户参与。用户喜欢智能分类、自动提取和智能格式化。投资者很高兴。产品团队在快速交付。
然后你打开了账单面板。
你的 OpenAI 账单在一月是 $480。二月是 $1,900。这个月趋向 $4,200。来自 AI 相关功能的收入?大约 $11,000/月。这意味着你 AI 功能收入的 38% 直接流向了 API 成本——而且这个比率在变糟,不是变好。
这就是 API 成本悬崖。每个 SaaS 团队都会遇到。问题不在于是否要从按 token 定价迁移出去——而是何时迁移,以及先迁移什么。
需要升级的三个信号
信号 1:API 支出超过 AI 功能收入的 15%
这是财务触发线。当你的 AI API 成本超过这些功能产生的收入的 15% 时,你在规模上的单位经济性就崩溃了。
信号 2:提示工程达到了天花板
你在提示上迭代了几个月。从 68% 准确率开始。提示工程让你达到 79%。添加 few-shot 示例推到 82%。你试了思维链、输出格式约束、自一致性检查。你在 84% 停滞了。
这就是提示工程天花板。
在 500 个标注示例上微调 7B 模型在分类任务上常规达到 91-94% 准确率。
信号 3:企业客户要求数据隐私
你的第一个企业客户发来了安全问卷。第 14 个问题:"客户数据是否离开你的基础设施用于 AI 处理?"
在你自己基础设施上运行的微调模型意味着客户数据永远不离开你的环境。
决策框架
| 因素 | 留在 API | 迁移到微调 |
|---|---|---|
| 每日查询量 | 低于 1,000 | 超过 5,000 |
| 任务类型 | 开放式推理、创意生成 | 分类、提取、格式化、结构化输出 |
| 准确率要求 | "足够好" (75-85%) | 业务关键 (90%+) |
| 数据敏感性 | 公开或低风险数据 | PII、PHI、金融数据、受监管内容 |
先迁移什么
首先迁移:高量窄任务
分类 — 工单分类、情感分析、内容审核、线索评分。 提取 — 从非结构化文本中提取结构化数据。 格式化和转换 — 将自由文本转为结构化模板。
其次迁移:特定领域生成
基于模板的生成 — 从模板写支持回复,生成品牌语调的产品描述。
保留在 API:广泛推理任务
开放式分析 — 需要超出领域范围的世界知识的任务。
迁移手册:四步法
第 1 步:确定最高 ROI 任务(第 1 周)
拉取 API 使用日志。按请求量排序。找到占最多 API 支出且输出窄而结构化的单一任务。
第 2 步:微调模型(第 2 周)
从生产数据中收集 300-500 个高质量标注示例。使用 Ertas Studio 微调。
第 3 步:与 API 进行 A/B 测试(第 3-4 周)
将 10% 流量路由到微调模型,90% 到 API。比较准确率、延迟和用户结果。
第 4 步:扩展(第 2-3 月)
重复迁移下一个最高量的任务。大多数 SaaS 产品可以在 90 天内将 60-80% 的 API 量迁移到微调模型。
升级后的单位经济性
| 功能 | 每日查询 | API 月费 | 微调月费 | 已迁移? |
|---|---|---|---|---|
| 工单分类 | 25,000 | $3,420 | $85 | 是 |
| 数据提取 | 15,000 | $2,850 | $85* | 是 |
| 开放式聊天 | 2,000 | $960 | — | 否(保留在 API) |
| 合计 | 42,000 | $7,230 | $1,130 |
月度节省:$6,100。年度节省:$73,200。
Ship AI that runs on your users' devices.
Ertas early bird pricing starts at $14.50/mo — locked in for life. Plans for builders and agencies.
延伸阅读
Ship AI that runs on your users' devices.
Early bird pricing starts at $14.50/mo — locked in for life. Plans for builders and agencies.
Keep reading

The SaaS AI Cost Cliff: Why Fine-Tuning Beats APIs at 10K+ Users
Total cost of ownership analysis for AI features from seed to Series B. Real math on the cost cliff, hidden multipliers, break-even points, and why investors care about AI margin.

Adding AI Features to Your SaaS Without an ML Team
Your customers expect AI features but you don't have ML engineers. Here's how SaaS product teams can fine-tune domain-specific models using their existing product data — no Python, no ML expertise, no API cost cliff.

EdTech AI Cost Reduction: Replace OpenAI API Calls With a Fine-Tuned Subject Model
EdTech platforms spending $2,000-15,000/month on OpenAI API for tutoring, feedback, and assessment can replace most of that spend with a fine-tuned local model at $20-40/month in infrastructure.