
停止使用他人的模型:Vibecoder 走向 AI 所有權之路
每個使用 OpenAI API 的應用程式都距離虧損只差一次漲價。模型所有權——訓練並自行部署你的模型——才是建立持久 AI 產品的方式。
有一個問題應該讓你感到不安:如果 OpenAI 明天把價格翻倍,你的應用程式會怎樣?
如果答案是「我的利潤會蒸發」或「我不得不關閉 AI 功能」,那麼你沒有 AI 產品。你有的是別人 AI 產品的包裝器。而那個「別人」掌控著你的經濟狀況。
這不是假設性的末日預言。OpenAI 之前已經棄用過模型。他們改變過定價結構。他們也調整過頻率限制。每次他們這樣做,數千個應用程式都在忙著調整。有些活不下去 。
模型所有權——在你的資料上訓練模型並自行部署——才是建立持久產品的方式。讓我們談談這實際上意味著什麼以及如何達到這個目標。
「GPT 包裝器」問題,直白地說
你用 Cursor 建立了一個應用程式。也許是內容寫作工具、客戶支援機器人,或是小眾行業助理。核心價值是 AI 功能。用戶註冊是因為 AI 能做有用的事情。
但問題是:這個 AI 不屬於你。它是 OpenAI 的 GPT-4o(或 Anthropic 的 Claude,或 Google 的 Gemini)。你是按 token 租用智能。
這造成了三個問題:
問題一:沒有定價控制。 當 OpenAI 設定每個 token 的價格,他們就是在設定你的利潤。如果他們漲價,你的利潤就縮水。你無法談判。你無法優化。你只能付錢。
問題二:沒有差異化。 你的競爭對手可以使用相同的模型和相同的 API。你的產品和他們的產品之間唯一的分隔是提示詞和使用者介面。提示詞可以被複製。介面可以被克隆。沒有可防禦的護城河。
問題三:沒有持續性保證。 OpenAI 棄用了 GPT-3.5 微調。他們定期淘汰舊版模型。如果他們棄用你的應用程式所依賴的模型,你就得忙著遷移——而新模型的行為可能不一樣。
這些不是邊緣案例。它們是 API 依賴模式中內建的結構性風險。
「模型所有權」的實際含義
讓我們解開這個謎團。模型所有權不是指:
- 從頭訓練模型(那需要數百萬美元)
- 成為機器學習研究員
- 建立你自己的 GPU 集群
- 理解 Transformer 架構的內部機制
模型所有權的含義是:
- 你拿一個開源基礎模型(Llama、Qwen、Phi)
- 你在你的資料上微調它——你的應用程式實際產生的輸入和輸出
- 你將它匯出為一個你可以下載和保存的檔案(GGUF 格式)
- 你在自己的基礎設施上運行它(帶有 Ollama 的 VPS)
結果:你伺服器上的一個模型檔案,能很好地完成你的任務。你擁有這個檔案。你擁有這些權重。沒有人可以棄用它、漲價或奪走它。你可以複製它、備份它、將它移到不同的硬體上,或在多台伺服器上分享它。
這就是所有權。不是比喻意義上的所有權。一個你持有和控制的實際檔案。
當 OpenAI 棄用你的模型時會發生什麼
這已經發生過多次。模式如下:
- OpenAI 宣布新的模型版本
- 他們為舊版本設定棄用日期(通常是 6–12 個月後)
- 開發者忙著用現有提示詞測試新版本
- 新版本的行為不同——輸出改變、格式轉移、邊緣案例中斷
- 開發者花幾週時間調整提示詞以匹配舊行為
- 有些應用程式從未完全恢復
最具破壞性的棄用是 GPT-3.5-turbo 系列。已為 gpt-3.5-turbo-0613 仔細調整提示詞的應用程式,突然不得不遷移到以不同方式處理指令的新版本。幾個月來完美運行的系統提示開始產生錯誤輸出。
API 上使用微調模型的人處境更糟。他們的微調模型與基礎模型版本綁定。當基礎版本棄用時,他們的微調模型變得無法使用。他們不得不在新基礎上重新微調——這意味著新的行為、新的錯誤、新的提示工程週期。
對於你擁有的模型?這些都不會發生。你的 GGUF 檔案不會過期。明年和後年,Llama 3.3 8B 在 Ollama 中仍然能用。沒有棄用通知。沒有遷移截止日期。沒 有你沒有選擇的行為改變。
當他們漲價時會發生什麼
OpenAI 的定價總體上呈下降趨勢,這讓人們自滿。但這個趨勢不是保證的,而且它掩蓋了一個更微妙的問題:他們為自己的收入優化定價,而不是為你的利潤。
以下是獨立應用程式面對定價壓力的情況:
- 你以 GPT-4o 每百萬輸入 token 2.50 美元的價格建立應用程式
- 你根據該成本結構設定訂閱價格
- 六個月後,你有了 5,000 個用戶,你的提示詞模式已經演變
- 你每個請求的平均 token 使用量悄悄增加了 40%(更長的對話、更多的上下文)
- 你每次互動的有效成本現在比你設定價格時高 40%
- 但你無法在不流失用戶的情況下提高訂閱價格
這幾乎發生在每個 AI 應用程式上。使用模式演變。提示詞變長。功能變複雜。按 token 計費的模式懲罰你改善產品。
固定成本 VPS 上的微調模型沒有這個問題。無論用戶發送短提示詞還是長提示詞,你的成本都一樣。無論你改善提示詞還是添加上下文視窗,你的成本都一樣。計費器不在運轉。
GGUF 優勢:真正的可攜性
當你將微調模型匯出為 GGUF 檔案時,你得到了一些非凡的東西:一個可以在任何地方運行的模型。
- Ollama 在 Linux VPS 上——最常見的生產設置
- llama.cpp 以獲得最高性能和控制
- LM Studio 在你的 Mac 上用於開發和測試
- Jan 提供好看的桌面介面
- 任何未來支援 GGUF 標準的工具
這與供應商鎖定完全相反。如果 Ollama 明天消失,你把 GGUF 加載到 llama.cpp 中。如果你想從 Hetzner 切換到 AWS,你複製這個檔案。如果你想在你的筆記型電腦上本地運行模型進行開發,你下載它。
你的模型是可攜的資產。它跟著你走。
與在 OpenAI 平台上的微調模型相比。它在哪裡?在 OpenAI 的伺服器上。你能下載它嗎?不能。你能在其他地方運行它嗎?不能。如果你停止支付 OpenAI,你能使用它嗎?不能。這不是你的模型。這是 OpenAI 的模型,你付費進行了定制。