
AI代理机构利润率计算器:API成本 vs 微调经济
停止猜测你的利润率。这个计算器精确分析你每个客户在API调用与微调模型上的支出——并展示微调何时开始盈利。
大多数AI代理机构老板能在500美元以内告诉你他们的月收入。问他们每个客户的AI基础设施成本,你会得到一个停顿、一个猜测,以及一个听起来像编造的数字。
这不是性格缺陷。API计费仪表板旨在显示总支出,而非每个客户的盈利能力。当你通过同一个OpenAI账户路由15个客户时,弄清楚哪个客户每月烧400美元、哪个烧80美元需要手动工作——没人做这个。
结果:你在盲目定价。
本文是一个计算器。我们将逐步计算两种模式 ——基于API和微调——的数学,以便你能根据自己的业务账本运行数据并做出明智决策。
第一节:API成本计算
每个客户每月API成本的核心公式:
月API成本 = (每次交互平均Token数) x (每天交互次数) x (30天) x (每Token价格)
每次交互的平均Token数
| 用例 | 平均输入Token | 平均输出Token | 每次交互总计 |
|---|---|---|---|
| 客服聊天机器人 | 350 | 250 | 600 |
| 文档问答/RAG | 800 | 400 | 1,200 |
| 潜客资格审查 | 200 | 150 | 350 |
| 内容生成 | 300 | 800 | 1,100 |
| 数据提取/分类 | 500 | 100 | 600 |
隐藏的乘数
重试率: 3-8%的API调用因速率限制、超时或格式错误响应需要重试。增加5%。
上下文窗口增长: 多轮聊天机器人,将平均值乘以2.5-3倍。
系统提示开销: 每个请求包含500-2,000 token的系统提示。
重度用户: 10-15%的用户产生50%以上的token量。
考虑乘数后,使用GPT-4o的客服聊天机器人(中型企业,100次交互/天)的实际月成本约$53。使用Claude 3.5 Sonnet约$71。
15个客户平均$60/月 = $900/月API成本。高流量客户可以推高到$2,000-4,000/月。
第二节:微调成本计算
微调模型的成本结构根本不同:固定而非可变。
固定月成本
| 成本项 | 月成本 | 备注 |
|---|---|---|
| Ertas计划 (每席位) | $14.50 | 微调、评估、适配器管理 |
| 带GPU的VPS | $50-120 | Hetzner、Lambda、RunPod等 |
| 域名/SSL | $1-2 | 每个客户API端点 |
3人代理机构:$43.50 (Ertas) + $80 (VPS) + $10 (杂项) = $133.50/月总计。
每客户边际成本
基础设施运行后,添加新客户成本:
- LoRA适配器存储:约150MB(可忽略)
- 推理计算:所有客户共享(在GPU饱和前无边际成本)
- 每客户总边际成本:约$2-5/月
第三节:交叉分析
在多少客户时微调胜过API?
假设:平均每客户API成本$180/月,微调基础设施$133.50/月 + 每客户$5/月。
| 客户数 | API总COGS | API毛利率 | 微调总COGS | 微调毛利率 |
|---|---|---|---|---|
| 1 | $180 | 88.0% | $138.50 | 90.8% |
| 3 | $540 | 88.0% | $148.50 | 96.7% |
| 5 | $900 | 88.0% | $158.50 | 97.9% |
| 15 | $2,700 | 88.0% | $208.50 | 99.1% |
交叉点在1个客户。如果你在轻量模型上平均每客户API成本只有$40/月,交叉点在4个客户。
决策框架
API成本线性增长。微调成本大部分固定。这意味着答案几乎总是相同的:微调随着规模增长而胜出。
对大多数代理机构来说,微调在3-5个客户以上胜过API成本。利润率改善10-15个百分点,转化为每月数千美元的额外毛利。
算算你自己的账。计算器不会说谎。
Ship AI that runs on your users' devices.
Ertas early bird pricing starts at $14.50/mo — locked in for life. Plans for builders and agencies.
延伸阅读
- How to Cut Your AI Agency Costs by 90% with Fine-Tuned Local Models -- 从API迁移到本地推理的操作手册。
- How to Price AI Services as an Agency -- 考虑成本结构并最大化利润率的定价策略。
Ship AI that runs on your users' devices.
Early bird pricing starts at $14.50/mo — locked in for life. Plans for builders and agencies.
Keep reading

Fine-Tuning for Voice AI Agents: Vapi, ElevenLabs, and Local Models
Voice AI agents running on GPT-4 cost $0.10-0.30 per minute of conversation. Fine-tuned local models cut that to near-zero. Here's how to build voice agents that don't bankrupt you per call.

90% Gross Margin AI Services: The Agency Model That Beats SaaS Economics
Most AI agencies run 50-60% gross margins because they're reselling API calls. Agencies using fine-tuned models on owned infrastructure hit 90%+ margins. Here's how the economics work.

Client-Specific AI Agents as Recurring Revenue: The Agency Pricing Playbook
The most profitable AI agencies don't sell projects — they sell per-client AI agents on monthly retainers. Here's the pricing playbook that turns one-time builds into $2K-10K/month recurring revenue.