
停止使用他人的模型:Vibecoder 走向 AI 所有權之路
每個使用 OpenAI API 的應用程式都距離虧損只差一次漲價。模型所有權——訓練並自行部署你的模型——才是建立持久 AI 產品的方式。
有一個問題應該讓你感到不安:如果 OpenAI 明天把價格翻倍,你的應用程式會怎樣?
如果答案是「我的利潤會蒸發」或「我不得不關閉 AI 功能」,那麼你沒有 AI 產品。你有的是別人 AI 產品的包裝器。而那個「別人」掌控著你的經濟狀況。
這不是假設性的末日預言。OpenAI 之前已經棄用過模型。他們改變過定價結構。他們也調整過頻率限制。每次他們這樣做,數千個應用程式都在忙著調整。有些活不下去。
模型所有權——在你的資料上訓練模型並自行部署——才是建立持久產品的方式。讓我們談談這實際上意味著什麼以及如何達到這個目標。
「GPT 包裝器」問題,直白地說
你用 Cursor 建立了一個應用程式。也許是內容寫作工具、客戶支援機器人,或是小眾行業助理。核心價值是 AI 功能。用戶註冊是因為 AI 能做有用的事情。
但問題是:這個 AI 不屬於你。它是 OpenAI 的 GPT-4o(或 Anthropic 的 Claude,或 Google 的 Gemini)。你是按 token 租用智能。
這造成了三個問題:
問題一:沒有定價控制。 當 OpenAI 設定每個 token 的價格,他們就是在設定你的利潤。如果他們漲價,你的利潤就縮水。你無法談判。你無法優化。你只能付錢。
問題二:沒有差異化。 你的競爭對手可以使用相同的模型和相同的 API。你的產品和他們的產品之間唯一的分隔是提示詞和使用者介面。提示詞可以被複製。介面可以被克隆。沒有可防禦的護城河。
問題三:沒有持續性保證。 OpenAI 棄用了 GPT-3.5 微調。他們定期淘汰舊版模型。如果他們棄用你的應用程式所依賴的模型,你就得忙著遷移——而新模型的行為可能不一樣。
這些不是邊緣案例。它們是 API 依賴模式中內建的結構性風險。
「模型所有權」的實際含義
讓我們解開這個謎團。模型所有權不是指:
- 從頭訓練模型(那需要數百萬美元)
- 成為機器學習研究員
- 建立你自己的 GPU 集群
- 理解 Transformer 架構的內部機制
模型所有權的含義是:
- 你拿一個開源基礎模型(Llama、Qwen、Phi)
- 你在你的資料上微調它——你的應用程式實際產生的輸入和輸出
- 你將它匯出為一個你可以下載和保存的檔案(GGUF 格式)
- 你在自己的基礎設施上運行它(帶有 Ollama 的 VPS)
結果:你伺服器上的一個模型檔案,能很好地完成你的任務。你擁有這個檔案。你擁有這些權重。沒有人可以棄用它、漲價或奪走它。你可以複製它、備份它、將它移到不同的硬體上,或在多台伺服器上分享它。
這就是所有權。不是比喻意義上的所有權。一個你持有和控制的實際檔案。
當 OpenAI 棄用你的模型時會發生什麼
這已經發生過多次。模式如下:
- OpenAI 宣布新的模型版本
- 他們為舊版本設定棄用日期(通常是 6–12 個月後)
- 開發者忙著用現有提示詞測試新版本
- 新版本的行為不同——輸出改變、格式轉移、邊緣案例中斷
- 開發者花幾週時間調整提示詞以匹配舊行為
- 有些應用程式從未完全恢復
最具破壞性的棄用是 GPT-3.5-turbo 系列。已為 gpt-3.5-turbo-0613 仔細調整提示詞的應用程式,突然不得不遷移到以不同方式處理指令的新版本。幾個月來完美運行的系統提示開始產生錯誤輸出。
API 上使用微調模 型的人處境更糟。他們的微調模型與基礎模型版本綁定。當基礎版本棄用時,他們的微調模型變得無法使用。他們不得不在新基礎上重新微調——這意味著新的行為、新的錯誤、新的提示工程週期。
對於你擁有的模型?這些都不會發生。你的 GGUF 檔案不會過期。明年和後年,Llama 3.3 8B 在 Ollama 中仍然能用。沒有棄用通知。沒有遷移截止日期。沒有你沒有選擇的行為改變。
當他們漲價時會發生什麼
OpenAI 的定價總體上呈下降趨勢,這讓人們自滿。但這個趨勢不是保證的,而且它掩蓋了一個更微妙的問題:他們為自己的收入優化定價,而不是為你的利潤。
以下是獨立應用程式面對定價壓力的情況:
- 你以 GPT-4o 每百萬輸入 token 2.50 美元的價格建立應用程式
- 你根據該成本結構設定訂閱價格
- 六個月後,你有了 5,000 個用戶,你的提示詞模式已經演變
- 你每個請求的平均 token 使用量悄悄增加了 40%(更長的對話、更多的上下文)
- 你每次互動的有效成本現在比你設定價格時高 40%
- 但你無法在不流失用戶的情況下提高訂閱價格
這幾乎發生在每個 AI 應用程式上。使用模式演變。提示詞變長。功能變複雜。按 token 計費的模式懲罰你改善產品。
固定成本 VPS 上的微調模型沒有這個問題。無論用戶發送短提示詞還是長提示詞,你的成本都一樣。無論你改善提示詞還是添加上下文視窗,你的成本都一樣。計費器不在運轉。
GGUF 優勢:真正的可攜性
當你將微調模型匯出為 GGUF 檔案時,你得到了一些非凡的東西:一個可以在任何地方運行的模型。
- Ollama 在 Linux VPS 上——最常見的生產設置
- llama.cpp 以獲得最高性能和控制
- LM Studio 在你的 Mac 上用於開發和測試
- Jan 提供好看的桌面介面
- 任何未來支援 GGUF 標準的工具
這與供應商鎖定完全相反。如果 Ollama 明天消失,你把 GGUF 加載到 llama.cpp 中。如果你想從 Hetzner 切換到 AWS,你複製這個檔案。如果你想在你的筆記型電腦上本地運行模型進行開發,你下載它。
你的模型是可攜的資產。它跟著你走。
與在 OpenAI 平台上的微調模型相比。它在哪裡?在 OpenAI 的伺服器上。你能下載它嗎?不能。你能在其他地方運行它嗎?不能。如果你停止支付 OpenAI,你能使用它嗎?不能。這不是你的模型。這是 OpenAI 的模型,你付費進行了定制。
模型所有權如何建立護城河
讓我們談談競爭優勢。
現在,任何人都可以建立 GPT-4o 包裝器。進入壁壘為零。如果你的應用程式的價值是「我們使用 GPT-4o 並且有好看的介面」,競爭對手可以在週末複製這個。他們確實擁有相同的 AI。
微調模型改變了這個等式:
你的模型在你的資料上訓練。 如果你建立了一個法律文件助理,你的模型已經看過你用戶數千份實際的法律文件,以及你的用戶偏好的特定輸出格式。你的競爭對手沒有相同的資料就無法複製這個。
你的模型隨使用而改善。 隨著你收集更多用戶資料,你的模型變得更好。這創造了飛輪效應:更好的模型 → 更多用戶 → 更多資料 → 更好的模型。你的競爭對手從零開始。
你的 模型擁有你的領域知識。 在醫療帳單代碼上微調的模型知道 GPT-4o 不知道的醫療帳單代碼相關知識。它整體上不更聰明——它在你的特定事物上更聰明。這種專業化是你的護城河。
你的模型的行為是一致的。 你控制權重。今天的模型行為與六個月後的行為相同。你的用戶可以依賴一致的行為。你在 API 上的競爭對手無法保證這一點——下一次模型更新可能會改變一切。
這是在沙土上建造和在基岩上建造的區別。表面上看起來一樣。其中一個能在風暴中存活下來。
實際路徑:一個週末從 API 消費者到模型擁有者
以下是具體的時間表:
週五晚上(2 小時)
匯出你的訓練資料。 瀏覽過去 30–60 天的 API 日誌。提取你核心 AI 功能的輸入-輸出對。格式化為 JSONL。你至少需要 1,500 個示例——在典型的應用程式流量下,這是幾天的日誌量。
清洗資料。 移除不良示例(錯誤、幻覺、用戶投訴)。移除異常值。保留代表你希望模型做什麼的示例。這是最重要的步驟——垃圾進,垃圾出。
上傳到 Ertas Vault。 建立資料集。上傳你的 JSONL 檔案。
週六上午(3 小時)
開始訓練運行。 選擇 Llama 3.3 8B 作為基礎模型。使用 LoRA 默認值(秩 16,學習率 2e-4,3 個 epoch)。點擊訓練。
在訓練運行期間(約 60 分鐘): 設置你的 VPS。啟動一個 Hetzner CAX31(32 GB ARM,約每月 16 美元)。安裝 Ollama。配置防火牆規則。如果你想要 HTTPS,用 nginx 設置反向代理。
評估你的模型。 訓練完成後,在 Ertas Studio 中檢查評估指標。從你應用程式的實際使用模式運行測試提示詞。將輸出與 GPT-4o 的輸出進行比較。
週六下午(2 小時)
匯出並部署。 將你的模型匯出為 GGUF(Q5_K_M 量化)。上傳到你的 VPS。建立 Ollama Modelfile。加載它。測試 API 端點。
整合測試。 將你應用程式的開發環境指向你的 VPS。執行你的核心用戶流程。驗證輸出是好的。
週日(2 小時)
部署。 更新你的生產應用程式配置以使用你的 VPS 端點。部署。在最初幾小時內監控。
設置備援方案。 配置你的應用程式,在你的 VPS 無響應時(維護、高負載等)回退到 OpenAI API。
總時間:週末大約 9 小時。持續的月成本:約 30–50 美元。你現在擁有了你的 AI。
為何這對退出價值很重要
如果你從長遠考慮——出售你的應用程式、籌集資金,或建立有持久價值的東西——模型所有權非常重要。
收購方看你的應用程式會看到兩件截然不同的事情:
依賴 API 的應用程式: 收入進來,API 成本出去。利潤稀薄且不可預測。核心技術不被擁有——它是被租用的。如果 API 改變,切換成本很高。結論:脆弱。
擁有模型的應用程式: 收入進來,基礎設施成本固定且低廉。有一個代表真實資產的專有訓練模型——訓練資料、嵌入在權重中的專業知識、部署基礎設施。沒有相同資料的競爭對手無法複製這個。結論:可防禦。
風險投資人和收購方越來越多地問:「你擁有什麼?」一個在獨特資料上訓練的微調模型是真實的答案。「我們使用 OpenAI API」不是。
所有權心態
Vibe coding 是關於快速發布。模型所有權是關於建立持久的東西。
這些並不矛盾。你可以在週末在 OpenAI API 上發布你的 MVP——你應該這樣做。但一旦你有了產品市場契合度和真實用戶,下一步就很清楚了:拿出你的用戶正在產生的資料,微調你自己的模型,停止依賴別人的基礎設施作為你的核心價值。
你應用程式的 AI 應該屬於你。不是因為這在意識形態上是純粹的,而是因為它對你的成本、你的用戶、你的競爭地位,以及你建立一個能夠存活的業務的能力更好。
停止使用他人 的模型。使用你自己的。
Ship AI that runs on your users' devices.
Free plan with 30 credits/mo, no card required. Paid plans from $25/mo USD.
延伸閱讀
- AI 模型所有權解釋 — 模型所有權在技術和法律方面含義的全面指南。
- GPT 包裝器陷阱 — 為何建立在封閉 API 之上比看起來更危險。
- API 依賴意味著沒有模型控制 — API 依賴的技術和業務風險。
Ship AI that runs on your users' devices.
Free plan with 30 credits/mo, no card required. Paid plans from $25/mo USD.
Keep reading

用每月 $50 構建 AI SaaS:微調本地堆疊
您不需要每月 $10,000 的 API 費用來發布 AI 功能。這裡是完整的堆疊——微調模型、Ollama、$30 的 VPS— —每月不到 $50 即可運行生產 AI SaaS。

你的 Vibe 編碼應用程式達到了 1,000 個用戶——接下來呢?
你用 Cursor 和 Bolt 快速發布。用戶喜歡它。但你的 OpenAI 帳單剛超過了每月 200 美元,而且還在增加。這是達到真實規模的 vibe 編碼應用程式的成本生存指南。

Vibecoder 的 AI 單位經濟學指南:免費層何時不再免費
OpenAI 的免費層讓你起步了。但在規模化時,你每月花 5,000 美元使用 Opus 來完成 Haiku 就能處理的任務。以下是如何像創辦人而非業餘愛好者那樣思考 AI 成本。