
unit economicson-device AImobile AIcost optimizationbusiness modelsegment:mobile-builder
裝置端 AI 單位經濟學:讓行動 AI 獲利的數學
裝置端 AI 對比雲端 API 的完整單位經濟學分析。固定成本、變動成本、損益平衡分析,以及規模化行動 AI 功能的獲利模型。
EErtas Team·
雲端 AI 有變動成本。每個使用者、每次請求都要花錢。裝置端 AI 有固定成本。微調一次、分發一次、永久免費運行。財務結構根本不同,對行動應用業務的影響是重大的。
本文分析了兩種方法的完整成本模型。
雲端 API 成本結構
變動成本(隨使用者增長)
| 成本項目 | 每使用者每月 | 10K 月活躍用戶 | 100K 月活躍用戶 |
|---|---|---|---|
| API tokens(GPT-4o-mini) | $0.05-0.10 | $500-1,000 | $5,000-10,000 |
| API tokens(Gemini Flash) | $0.03-0.06 | $300-600 | $3,000-6,000 |
| 伺服器基礎設施(代理/佇列) | $0.01-0.02 | $100-200 | $1,000-2,000 |
| 變動成本總計 | $0.06-0.12 | $600-1,200 | $6,000-12,000 |
固定成本(不隨規模增長)
| 成本項目 | 每月 |
|---|---|
| 開發者時間(提示工程、維護) | $2,000-5,000 |
| 監控和日誌 | $50-200 |
| 固定成本總計 | $2,050-5,200 |
雲端 AI 總成本
10K 月活躍用戶:$2,650-6,400/月 100K 月活躍用戶:$8,050-17,200/月
在規模化時,變動成本佔據主導。在 100K 月活躍用戶時,變動成本占 AI 總支出的 75-85%。
裝置端成本結構
一次性成本
| 成本項目 | 金額 | 頻率 |
|---|---|---|
| 訓練資料準備 | $500-2,000(開發者時間) | 一次,之後增量 |
| 微調運算 | $5-50 | 每次訓練運行 |
| llama.cpp 整合 | $1,000-3,000(開發者時間) | 一次 |
| 跨裝置測試 | $500-1,500(開發者時間) | 每次模型更新 |
| 一次性成本總計 | $2,005-6,550 |
經常性固定成本
| 成本項目 | 每月 |
|---|---|
| 模型分發 CDN | $50-200(每月 100K 次下載) |
| 模型重新訓練(每季) | 每次 $5-50 = 分攤後 $2-17/月 |
| 開發者維護 | $500-1,000 |
| 經常性成本總計 | $552-1,217 |
變動成本
| 成本項目 | 每使用者每月 |
|---|---|
| 每位新使用者的 CDN 頻寬 | 約 $0.08-0.15(一次性模型下載) |
| 每次推論成本 | $0.00 |
| 變動成本總計 | 約 $0.00(初始下載後) |
裝置端總成本
10K 月活躍用戶:$552-1,217/月 + 分攤的一次性成本 100K 月活躍用戶:$552-1,217/月 + 分攤的一次性成本
無論使用者數量多少,成本幾乎是平坦的。CDN 成本隨著新使用者下載略有增加,但與 API token 成本相比是微不足道的。
損益平衡分析
裝置端何時變得比雲端 API 更便宜?