Back to blog
    SaaS AI 成本悬崖:为什么微调在 10K+ 用户时比 API 更优
    saascost-analysisfine-tuningscalingapi-costssegment:builder

    SaaS AI 成本悬崖:为什么微调在 10K+ 用户时比 API 更优

    从种子轮到 B 轮的 AI 功能总拥有成本分析。关于成本悬崖、隐藏乘数、盈亏平衡点的真实计算,以及投资者为何关注 AI 利润率。

    EErtas Team·

    每家 SaaS 公司的成长中都有一个特定时刻,AI API 成本从四舍五入的误差变成了 CFO 会询问的明细项。我们称之为成本悬崖:线性 API 成本与增长曲线碰撞的时刻,你的 AI 功能利润率在一个季度内从健康变为不可持续。

    本文提供了精确的计算。读完后,你将了解你的成本悬崖、盈亏平衡点以及应对方法。

    成本悬崖解释

    SaaS 基础设施成本是次线性的。一个 200 美元/月的数据库服务器能处理比 20 美元/月服务器多 10 倍的用户。CDN 成本增长缓慢,因为大多数内容被缓存。支持成本增长缓慢,因为文档和自助服务处理了边际用户。

    AI API 成本是线性的。每次查询成本相同。第 100,000 次查询与第一次成本相同。没有规模经济,没有缓存收益(每次查询都是唯一的),没有边际成本降低。

    这创造了一个分歧。你的每用户收入是固定的(或随追加销售缓慢增长)。你的每用户 AI 成本是固定的。但你的每用户非 AI 成本随着规模扩大而降低。结果:随着增长,AI 成本占 COGS 的比例越来越大。

    每个增长阶段的总拥有成本

    让我们建模一个真实的 SaaS 公司添加 AI 功能。假设:

    • AI 功能:内容建议、搜索和分类
    • 每个活跃用户平均每天 15 次 AI 查询
    • 每次查询平均 600 token(输入 + 输出)
    • 40% 注册用户月活
    • GPT-4o-mini 定价:$0.15/1M 输入 token,$0.60/1M 输出 token(混合 ~$0.30/1M)

    种子阶段:500-2,000 用户

    指标
    注册用户1,500
    活跃用户 (40%)600
    每日 AI 查询9,000
    月度 AI 查询270,000
    月度 token 数162M
    月度 API 成本$48.60
    每活跃用户月度成本$0.08
    毛利率影响可忽略

    在此阶段,API 成本是看不见的。每月 48 美元比你的 Slack 账单还少。这就是为什么每个 SaaS 创始人从 API 开始——经济性没问题。

    B 轮:50,000-200,000 用户

    指标
    注册用户80,000
    活跃用户 (40%)32,000
    每日 AI 查询480,000
    月度 AI 查询14,400,000
    月度 token 数8.6B
    月度 API 成本$2,592
    每活跃用户月度成本$0.08
    毛利率影响3-8%

    现在悬崖可见了。$2,592/月就是 $31,104/年。

    真实数字更糟。 因为隐藏乘数。

    隐藏的成本乘数

    以上基本 token 计算是天真的。在生产中,几个因素将你的实际 API 成本在理论最小值上乘以 1.5-4 倍。

    系统提示(1.3-1.8 倍)、RAG 上下文(1.5-2.5 倍)、重试和回退(1.1-1.3 倍)、对话历史(1.5-3 倍)——这些乘数是相乘的。

    使用标准 AI 功能的真实 B 轮成本:

    $2,592 基础 x 2.77 乘数 = $7,180/月 = $86,160/年

    这不是四舍五入的误差。这是一个人员编制。

    盈亏分析:API 对比微调

    微调模型部署在专用基础设施上,无论查询量如何都有固定月成本。

    微调模型月成本使用 $75/月作为中位数。

    盈亏平衡:约 200,000 次查询/月。 这大约是每天 15 次查询的 1,100 个活跃用户。

    为什么投资者关注 AI 利润率

    投资者通过毛利率评估 SaaS 公司。基准是 75-85%。AI API 成本压缩了这一比率。

    64% 毛利率的 SaaS 获得的估值倍数与 87% 毛利率的截然不同。在 10 倍 ARR 倍数基准下,差异是实质性的——同样的产品、同样的用户、同样的收入,但因为不同的基础设施,估值差异达到 2000-3000 万美元。

    迁移路径

    你不需要一夜之间切换。明智的路径是渐进的:

    第一阶段:识别(第 1 周)

    按成本审计你的 AI 功能。从最高量、最简单的功能开始。分类和搜索是理想的首选候选——狭窄的任务,小模型,高量。

    第二阶段:微调(第 2-3 周)

    取你成本最高的功能。从生产日志中收集 200-500 个训练示例。微调 3B-7B 模型。与 API 基线测试。

    第三阶段:部署和监控(第 3-4 周)

    在 API 旁边运行微调模型 1-2 周。比较质量、延迟和成本。满意后,将流量路由到微调模型。

    第四阶段:扩展(第 2-3 月)

    迁移下一个功能。然后是下一个。每次迁移都比上一次更快,因为你已经有了基础设施和工作流。

    目标:90 天内 60-80% 的 AI 查询在微调模型上运行。

    Ship AI that runs on your users' devices.

    Ertas early bird pricing starts at $14.50/mo — locked in for life. Plans for builders and agencies.

    数学不会说谎

    成本悬崖不是理论问题。对于任何在 API 定价上扩展 AI 功能的 SaaS 来说,这是算术上的必然性。

    在 5,000 用户时就意识到这一点的公司——在悬崖变成危机之前——建立了随增长而复合的持久利润优势。在 50,000 用户时才意识到的公司已经花费了数十万不必要的美元。

    为你的产品算一算。悬崖比你想象的更近。

    延伸阅读

    Ship AI that runs on your users' devices.

    Early bird pricing starts at $14.50/mo — locked in for life. Plans for builders and agencies.

    Keep reading