
行動應用程式的 OpenAI API:快速入門與沒人提到的費用
在 iOS 和 Android 應用程式中整合 OpenAI API 的實用指南,包含大多數教學跳過的 1K 到 100K 使用者真實成本預估。
每篇關於在行動應用程式中加入 AI 的教學都以相同方式開始:取得 API 金鑰、發送 POST 請求、顯示回應。很簡單。但它們都沒有提到當真正的使用者開始使用功能時,你的帳單會發生什麼事。
本指南提供你兩個面向。你需要的快速入門整合方式,以及 你需要在擴展中存活的成本計算。
快速入門
從行動應用程式整合 OpenAI 的 API 很直接。以下是兩個平台的模式。
Swift (iOS)
func sendMessage(_ message: String) async throws -> String {
var request = URLRequest(url: URL(string: "https://api.openai.com/v1/chat/completions")!)
request.httpMethod = "POST"
request.setValue("Bearer \(apiKey)", forHTTPHeaderField: "Authorization")
request.setValue("application/json", forHTTPHeaderField: "Content-Type")
let body: [String: Any] = [
"model": "gpt-4o-mini",
"messages": [
["role": "system", "content": systemPrompt],
["role": "user", "content": message]
]
]
request.httpBody = try JSONSerialization.data(withJSONObject: body)
let (data, _) = try await URLSession.shared.data(for: request)
let response = try JSONDecoder().decode(ChatResponse.self, from: data)
return response.choices.first?.message.content ?? ""
}
Kotlin (Android)
suspend fun sendMessage(message: String): String {
val client = OkHttpClient()
val json = JSONObject().apply {
put("model", "gpt-4o-mini")
put("messages", JSONArray().apply {
put(JSONObject().put("role", "system").put("content", systemPrompt))
put(JSONObject().put("role", "user").put("content", message))
})
}
val request = Request.Builder()
.url("https://api.openai.com/v1/chat/completions")
.post(json.toString().toRequestBody("application/json".toMediaType()))
.addHeader("Authorization", "Bearer $apiKey")
.build()
val response = client.newCall(request).execute()
return JSONObject(response.body!!.string())
.getJSONArray("choices")
.getJSONObject(0)
.getJSONObject("message")
.getString("content")
}
這是簡單的部分。發布後就能運作。現在來看教學跳過的部分。
價格概況(2026 年初)
| 模型 | 輸入(每百萬 token) | 輸出(每百萬 token) | 最適用於 |
|---|---|---|---|
| GPT-4o | $2.50 | $10.00 | 複雜推理 |
| GPT-4.1-mini | $0.40 | $1.60 | 品質與成本平衡 |
| GPT-4o-mini | $0.15 | $0.60 | 成本敏感的應用程式 |
輸出 token 比輸入 token 貴 2.5-4 倍。這很重要,因為大多數成本估算都低估了輸出的部分。
天真的估算 vs 現實
天真的成本計算:(輸入 token + 輸出 token)* 每個 token 的價格 * 請求數。這是錯的。它嚴重低估了真實成本,因為忽略了隱藏的乘數。
隱藏乘數 1:系統提示
你的系統提示會隨每一次 API 呼叫一起傳送。它不會在請求之間被快取。典型的行動應用程式系統提示有 500-1,500 個 token。有些達到 2,000 以上。
以每個系統提示 1,000 個 token、10,000 MAU 每天發送 3 次請求計算:光是系統提示每月就多出 9 億個額外輸入 token。以 GPT-4o-mini 的費率計算,光這一項每月就要 $135。
隱藏乘數 2:對話歷史
基於聊天的功能會包含先前的訊息作為上下文。到第三輪對話時,你已經在重新傳送前兩輪加上系統提示。到第五輪時,你在重新傳送所有內容。
一個 5 輪對話,每則訊息 500 個 token:第 1 輪 = 500 個 token,第 2 輪 = 1,500,第 3 輪 = 2,500,第 4 輪 = 3,500,第 5 輪 = 4,500。總輸入:12,500 個 token,但使用者感覺只有 5 則短訊息。
隱藏乘數 3:重試和失敗
在規模化運作時,2-5% 的 API 呼叫會失敗(速率限制、逾時、伺服器錯誤)並需要重試。每次重試都是完整重新傳送整個提示,包括系統提示和歷史紀錄。
隱藏乘數 4:真實總計
當你把系統提示、對話歷史成長和重試開銷加在一起,真實的 費用通常是天真估算的 3-5 倍。
規模化成本表
使用行動 AI 助手模式:每天 3 次互動、每次互動 1,000 個 token(天真估算),套用 3 倍的隱藏成本乘數。
GPT-4o-mini($0.15 / $0.60 每百萬 token)
| MAU | 天真月費 | 真實月費 (3x) |
|---|---|---|
| 1,000 | $33.75 | $101 |
| 5,000 | $168.75 | $506 |
| 10,000 | $337.50 | $1,013 |
| 50,000 | $1,687.50 | $5,063 |
| 100,000 | $3,375.00 | $10,125 |
GPT-4o($2.50 / $10.00 每百萬 token)
| MAU | 天真月費 | 真實月費 (3x) |
|---|---|---|
| 1,000 | $562.50 | $1,688 |
| 5,000 | $2,812.50 | $8,438 |
| 10,000 | $5,625.00 | $16,875 |
| 50,000 | $28,125.00 | $84,375 |
| 100,000 | $56,250.00 | $168,750 |
如果你的應用程式每月收費 $4.99,在 10K MAU 時你的營收是 $49,900。GPT-4o 吃掉其中的 $16,875,佔營收的 34%,僅僅用於 AI 推論。GPT-4o-mini 好一些,$1,013,但仍然佔營收 2% 且隨使用者線性成長。
當數學算不過來的時候
根本問題是成本結構,而不是每個 token 的價格。雲端 AI 是隨每位使用者成長的變動成本。每一項價格最佳化(切換模型、縮短提示長度、快取)都只是爭取時間,並不改變底層曲線。
替代方案是裝置端推論。在你的領域資料上微調小型模型,匯出為 GGUF,透過 llama.cpp 在本地端執行。一次性微調費用 $5-50。之後每次推論成本為零,不論 MAU 多少。
微調的 3B 模 型在領域特定任務上達到 94% 的準確率,而 GPT-4 使用提示工程僅有 71%。對於大多數行動應用程式的使用情境(聊天助手、分類、內容撰寫),裝置端模型不只更便宜,在特定任務上表現更好。
像 Ertas 這樣的平台以視覺化介面處理微調流程:上傳資料、在雲端 GPU 上訓練、匯出 GGUF、部署到你的應用程式。從雲端 API 轉向裝置端不需要 ML 團隊。
現在該怎麼做
從 GPT-4o-mini 開始。它是驗證用途中成本和能力的最佳平衡。建立功能、發布它、確認使用者會使用它。
從第一天就追蹤你的實際 token 使用量。不是天真的估算,而是包含系統提示、對話歷史和重試在內的真實數字。建立一個顯示每位使用者每月成本的儀表板。
當這個數字超過每位使用者每月 $0.05 時,就開始規劃遷移到裝置端。你的 API 日誌已經包含了你需要的訓練資料。
Ship AI that runs on your users' devices.
Early bird pricing starts at $14.50/mo — locked in for life. Plans for builders and agencies.
Keep reading

How to Add AI to Your Mobile App: A Developer's Decision Guide
A comprehensive guide covering every approach to adding AI features to iOS and Android apps. Cloud APIs, on-device models, and hybrid architectures compared with real cost and performance data.

Google Gemini API for Mobile: Pricing, Limits, and When to Go On-Device
Google's Gemini API offers aggressive pricing and native Android integration. Here's what the pricing actually looks like at scale, where the free tier ends, and when on-device models make more sense.

AI in iOS Apps: CoreML, Cloud APIs, and On-Device LLMs Compared
Three paths to AI in your iOS app. CoreML for Apple's ecosystem, cloud APIs for capability, and on-device LLMs via llama.cpp for cost and privacy. A practical comparison for Swift developers.