Back to blog
    裝置端 AI 單位經濟學:讓行動 AI 獲利的數學
    unit economicson-device AImobile AIcost optimizationbusiness modelsegment:mobile-builder

    裝置端 AI 單位經濟學:讓行動 AI 獲利的數學

    裝置端 AI 對比雲端 API 的完整單位經濟學分析。固定成本、變動成本、損益平衡分析,以及規模化行動 AI 功能的獲利模型。

    EErtas Team·

    雲端 AI 有變動成本。每個使用者、每次請求都要花錢。裝置端 AI 有固定成本。微調一次、分發一次、永久免費運行。財務結構根本不同,對行動應用業務的影響是重大的。

    本文分析了兩種方法的完整成本模型。

    雲端 API 成本結構

    變動成本(隨使用者增長)

    成本項目每使用者每月10K 月活躍用戶100K 月活躍用戶
    API tokens(GPT-4o-mini)$0.05-0.10$500-1,000$5,000-10,000
    API tokens(Gemini Flash)$0.03-0.06$300-600$3,000-6,000
    伺服器基礎設施(代理/佇列)$0.01-0.02$100-200$1,000-2,000
    變動成本總計$0.06-0.12$600-1,200$6,000-12,000

    固定成本(不隨規模增長)

    成本項目每月
    開發者時間(提示工程、維護)$2,000-5,000
    監控和日誌$50-200
    固定成本總計$2,050-5,200

    雲端 AI 總成本

    10K 月活躍用戶:$2,650-6,400/月 100K 月活躍用戶:$8,050-17,200/月

    在規模化時,變動成本佔據主導。在 100K 月活躍用戶時,變動成本占 AI 總支出的 75-85%。

    裝置端成本結構

    一次性成本

    成本項目金額頻率
    訓練資料準備$500-2,000(開發者時間)一次,之後增量
    微調運算$5-50每次訓練運行
    llama.cpp 整合$1,000-3,000(開發者時間)一次
    跨裝置測試$500-1,500(開發者時間)每次模型更新
    一次性成本總計$2,005-6,550

    經常性固定成本

    成本項目每月
    模型分發 CDN$50-200(每月 100K 次下載)
    模型重新訓練(每季)每次 $5-50 = 分攤後 $2-17/月
    開發者維護$500-1,000
    經常性成本總計$552-1,217

    變動成本

    成本項目每使用者每月
    每位新使用者的 CDN 頻寬約 $0.08-0.15(一次性模型下載)
    每次推論成本$0.00
    變動成本總計約 $0.00(初始下載後)

    裝置端總成本

    10K 月活躍用戶:$552-1,217/月 + 分攤的一次性成本 100K 月活躍用戶:$552-1,217/月 + 分攤的一次性成本

    無論使用者數量多少,成本幾乎是平坦的。CDN 成本隨著新使用者下載略有增加,但與 API token 成本相比是微不足道的。

    損益平衡分析

    裝置端何時變得比雲端 API 更便宜?

    對比 GPT-4o-mini

    月活躍用戶雲端每月裝置端每月節省
    500$2,680$1,052$1,628(61%)
    1,000$2,750$1,052$1,698(62%)
    5,000$3,150$1,052$2,098(67%)
    10,000$3,650$1,102$2,548(70%)
    50,000$7,550$1,152$6,398(85%)
    100,000$12,550$1,217$11,333(90%)

    損益平衡點:500 月活躍用戶以下。 裝置端從本質上在第一個月就更便宜,因為一次性微調成本($5-50)比任何有意義的使用者數量下單月的雲端 API 成本都低。

    對比 Gemini Flash(最便宜的雲端 API)

    月活躍用戶雲端每月裝置端每月節省
    1,000$2,380$1,052$1,328(56%)
    10,000$2,950$1,102$1,848(63%)
    100,000$8,250$1,217$7,033(85%)

    即使對比最便宜的雲端 API,在任何非微量使用者數下,裝置端從第一天起就省錢。

    規模化優勢

    裝置端的財務優勢隨著成長而複合:

    雲端: 從 10K 增長到 100K 月活躍用戶,每月增加 $9,000-10,000 的變動成本。 裝置端: 從 10K 增長到 100K 月活躍用戶,每月增加約 $65-115 的 CDN 成本。

    這是核心洞察。雲端 AI 的利潤率隨著規模而壓縮。裝置端 AI 的利潤率隨著規模而改善。基礎設施成本分攤到更多使用者上,每位使用者的變動成本貢獻為 $0。

    對應用程式商業模式的影響

    訂閱應用($4.99/月)

    模式每使用者 AI 成本佔收入百分比毛利率影響
    雲端(GPT-4o-mini)$0.081.6%每使用者 -1.6%
    雲端(Gemini Flash)$0.051.0%每使用者 -1.0%
    裝置端約 $0.010.2%每使用者 -0.2%

    裝置端將 AI 的利潤率影響降低了 5-8 倍。

    免費增值應用

    免費增值應用是差異最明顯的地方。免費使用者產生成本但零收入。

    使用雲端 AI:每位免費使用者每月花費 $0.05-0.10 的 API 呼叫。如果 90% 的使用者是免費的,付費使用者必須承擔 10 倍自己的 AI 成本。

    使用裝置端 AI:免費使用者幾乎沒有成本。模型在他們的裝置上運行。唯一的成本是一次性的模型下載(約 $0.08-0.15 CDN 頻寬)。

    這完全改變了免費增值的數學。你可以向免費使用者提供 AI 功能,而不用擔心每位免費使用者的成本會摧毀你的利潤率。

    廣告支撐應用

    每位使用者的平均廣告收入:$0.50-2.00/月。雲端 AI 每使用者 $0.05-0.10 吃掉廣告收入的 2.5-20%。裝置端 AI 每使用者約 $0.01 吃掉 0.5-2%。差異可能是可持續和不可持續業務之間的利潤差距。

    投資回收

    將裝置端 AI 視為資本投資。前期成本(完整流程 $2,000-6,500)回收很快:

    替代的雲端成本回收期
    $500/月4-13 個月
    $1,000/月2-7 個月
    $3,000/月不到 2 個月
    $10,000/月不到 1 個月

    在雲端 API 成本 $3,000/月(30-50K 月活躍用戶常見)時,整個裝置端投資在不到兩個月內就能回本。

    像 Ertas 這樣的平台透過處理微調基礎設施來降低前期投資。你帶來訓練資料。Ertas 提供運算、訓練流程和 GGUF 匯出。一次性成本降低到微調運算($5-50)加上你準備訓練資料的時間。

    應該建模什麼

    在承諾任一方法之前,建立一個簡單的試算表:

    1. 目前每使用者的雲端 AI 成本(從你的帳單儀表板)
    2. 預計使用者成長(每月)
    3. 雲端成本曲線(每使用者成本 * 預計月活躍用戶)
    4. 裝置端固定成本(微調 + 整合 + 維護)
    5. 損益平衡月份(累計雲端成本超過累計裝置端成本的時間點)

    對於大多數行動應用,損益平衡是以月計算的,而非以年。你越早做切換,在產品生命週期中節省的就越多。

    Ship AI that runs on your users' devices.

    Early bird pricing starts at $14.50/mo — locked in for life. Plans for builders and agencies.

    Ship AI that runs on your users' devices.

    Early bird pricing starts at $14.50/mo — locked in for life. Plans for builders and agencies.

    Keep reading