OpenAI 在 6 個月內棄用了 5 個模型——這讓企業付出了多少代價

您的 AI 預算中有一個成本沒有出現在任何發票上。它不會出現在按 Token 計算中。它不是您的 API 支出追蹤的一部分。但對於數千家在 OpenAI 平台上構建的企業，它正在成為 AI 運營中最大的支出項目之一。

這就是棄用稅——由 OpenAI 退役模型速度快於企業適應速度所造成的工程時間、生產力損失和業務中斷。

棄用時間線

在六個月的時間裡，OpenAI 棄用或宣布了五個主要產品的終止服務：

2026 年 1 月——GPT-4o 被棄用。 OpenAI 宣布退役 GPT-4o，大約提前兩週通知。這是生產中使用最廣泛的模型之一，開發者花費了幾個月時間針對其行為模式優化提示詞。後繼模型的行為不同——不一定更差，但不同——需要在每個整合中重寫提示詞和進行回歸測試。

2026 年 3 月——Realtime API Beta 被棄用。 在此 API 上構建語音啟用和實時交互功能的團隊不得不尋找替代方案或重新構建。

2026 年 5 月——DALL-E-3 棄用計劃。 創意工具、行銷自動化平台和生成產品圖片的電子商務解決方案都受到影響。OpenAI 開發者社群表達了極大的挫折感，一些人稱其為「巨大的錯誤」。

2026 年 8 月——Assistants API 停用公告。 這是最大的中斷。數千名開發者在 Assistants API 上構建了生產系統——具有線程、文件搜索和函數調用的完整應用程式。整個抽象層被移除了。不是更新了。是移除了。每一個這樣的應用程式都需要重寫。

持續進行——遺留模型退役。 GPT-3.5 Turbo 變體、舊的微調模型和其他端點繼續按滾動計劃退役。

隱藏成本計算

每次棄用事件都會觸發相同的順序：通知、影響評估、遷移規劃、實施、測試和部署。這項工作是強制性的——跳過它，您的應用程式就會崩潰。

每次棄用的工程小時數

活動	小時數（保守估計）	小時數（複雜整合）
影響評估和規劃	4 至 8	8 至 16
提示詞重寫和調整	8 至 16	16 至 40
整合代碼更改	4 至 8	16 至 32
測試和回歸	8 至 16	24 至 48
部署和監控	4 至 8	8 至 16
總計	28 至 56 小時	72 至 152 小時

對於以每小時 100 至 150 美元的工程費率支付的中型市場公司，這是每次棄用事件 2,800 至 22,800 美元。

年度影響

如果您每年遇到 3 至 4 次棄用事件（這是當前的速度），年度成本是：

小型整合： 每年 8,400 至 22,400 美元
中型整合： 每年 21,600 至 60,800 美元
複雜整合： 每年 43,200 至 91,200 美元

這些數字不包括機會成本——您沒有構建的功能、您沒有發布的改進，因為您的工程團隊忙於維持現有的 AI 整合。

複合效應

棄用成本與投資複合。您越優化針對特定模型的提示詞，模型更改時這些提示詞就越容易崩潰。您越深度整合 API，每次遷移需要的代碼更改就越多。您越依賴模型特定的行為，切換後需要的測試就越多。

您為充分利用 AI 供應商所做的投資矛盾地增加了您對棄用的脆弱性。最努力優化 GPT-4o 提示詞的團隊在其被退役時付出了最高的遷移成本。

開發者怎麼說

OpenAI 開發者社群論壇清楚地講述了這個故事。在 DALL-E-3 棄用公告之後，開發者描述其為「巨大的錯誤」。在 Assistants API 停用之後，主要情緒是挫折——不是對技術變化，而是對這種模式。

常見的抱怨：

通知時間太短。 兩週時間遷移一個優化了幾個月的生產系統。
行為變化沒有文件記錄。 新模型「不同」，但確切的差異沒有說明。團隊通過生產中的損壞輸出發現它們。
沒有遷移工具。 OpenAI 提供了關於新模型的文件，但很少提供用於提示詞工程或整合更改的自動遷移路徑。
沒有向後相容性承諾。 與有棄用政策和長期支援版本的傳統軟體 API 不同，AI 模型 API 不提供穩定性保證。

模式很清楚：OpenAI 為其自己的產品路線圖優化，而非為其 API 消費者的穩定性優化。

為什麼這種情況將繼續發生

棄用不是 AI API 商業模型中的錯誤。這是一個特性。

推動遷移的商業激勵。 較新的模型通常比較舊的模型更貴（按 Token 計算）。每次棄用都將用戶推向更新、更貴的產品。即使您的 AI 品質沒有提高，供應商的收入在您遷移時也會增加。

沒有向後相容性要求。 與傳統軟體 API（避免破壞性更改，棄用的端點有多年的停用期）不同，AI API 已經建立了快速迭代而沒有穩定性承諾的規範。

模型不是產品——訂閱才是。 雲端 AI 供應商不是在賣給您一個特定的模型。他們是在賣給您持續訪問其最新模型的服務。這意味著您優化過的特定模型，從他們的角度來看，是一個可以隨意更改的實現細節。

基礎設施效率。 運行多個模型版本會耗費供應商的計算資源。棄用舊模型為更新（更有利可圖的）產品釋放容量。

這不會改變。激勵結構保證了棄用將繼續是 AI API 平台的常規特性。

替代方案：不會被棄用的模型

這裡有一個 API 商業模式掩蓋的真相：您擁有的模型沒有棄用日期。

當您微調一個開源模型並將其導出為 GGUF 時，您在硬體上有一個文件。那個文件在 Ollama、llama.cpp、LM Studio 或任何兼容的推理引擎上運行。它明天會運行。它明年會運行。它五年後會在您選擇的任何硬體上運行。

沒有人可以棄用它。沒有人可以改變它的行為。沒有人可以要求您遷移。沒有人向您發送兩週的通知。

模型是您的。句號。

厭倦了每 3 個月重寫您的 AI 技術棧？一次微調，永久擁有。加入 Ertas 優先預約 →

防棄用替代方案

比較三年的兩種方法：

API 依賴路徑

第 1 年：12,000 美元 API 成本 + 36,000 美元棄用遷移成本
第 2 年：14,400 美元 API 成本（價格提高）+ 48,000 美元棄用遷移成本（更多整合需要遷移）
第 3 年：17,280 美元 API 成本 + 48,000 美元棄用遷移成本
3 年總計：約 175,680 美元
最終您擁有的模型：0 個

微調路徑

第 1 年：5,000 美元初始微調投資 + 3,600 美元推理成本 + 0 美元棄用成本
第 2 年：2,000 美元重新訓練/改進 + 3,600 美元推理成本 + 0 美元棄用成本
第 3 年：2,000 美元重新訓練/改進 + 3,600 美元推理成本 + 0 美元棄用成本
3 年總計：約 19,800 美元
最終您擁有的模型：全部

微調路徑三年成本減少 89%。而且差距每年都在增大，因為您的成本是固定的，而 API 成本和棄用稅則在複合增長。

GGUF：防棄用格式

GGUF 是使這成為可能的開放模型格式。它受每個主要本地推理引擎支援，不受任何單一公司控制。

GGUF 文件包含運行模型所需的一切：權重、分詞器和配置。它不回撥。它不檢查授權伺服器。它不過期。

運行 GGUF 文件的推理引擎本身也是開源的——Ollama、llama.cpp 和 LM Studio 都是由社群維護，具有廣泛採用。即使某個項目停止，格式也是開放的，存在替代方案。

這就是 AI 中「未來可靠」的真正含義。不是賭一個供應商的持續善意。擁有一個獨立於任何供應商的業務決策而運作的文件。

下一步該做什麼

如果您目前依賴 AI API，這裡是實際的前進路徑：

1. 稽核您的棄用曝露。 列出您的應用程式依賴的每個模型和 API 版本。對照供應商的棄用時間表核對每個。計算如果每個明天都被棄用，您的遷移成本。

2. 識別您的最高工作量任務。 這些是您的第一批微調候選。具有一致輸入/輸出格式和可用訓練資料的任務（您的 API 日誌就是訓練資料）。

3. 微調一個模型。 從單個高工作量任務開始。在開源基礎模型上微調。將品質與您當前的 API 解決方案進行比較。

4. 並行部署。 在 API 旁邊運行微調模型。將一定比例的流量路由到它。驗證品質並測量成本節省。

5. 系統性擴展。 您遷移到微調模型的每個任務都刪除了一個棄用風險和一個按 Token 計費的成本項目。

90 天遷移手冊詳細介紹了這個過程，有逐週的里程碑。

您不必一次性遷移所有內容。但您確實需要開始——因為下一個棄用通知已經在起草中了。

您的微調模型沒有棄用日期。以早鳥定價預訂 Ertas。Builder 層每月 14.50 美元終身有效。查看方案 →