停止使用他人的模型：Vibecoder 走向 AI 所有權之路

有一個問題應該讓你感到不安：如果 OpenAI 明天把價格翻倍，你的應用程式會怎樣？

如果答案是「我的利潤會蒸發」或「我不得不關閉 AI 功能」，那麼你沒有 AI 產品。你有的是別人 AI 產品的包裝器。而那個「別人」掌控著你的經濟狀況。

這不是假設性的末日預言。OpenAI 之前已經棄用過模型。他們改變過定價結構。他們也調整過頻率限制。每次他們這樣做，數千個應用程式都在忙著調整。有些活不下去。

模型所有權——在你的資料上訓練模型並自行部署——才是建立持久產品的方式。讓我們談談這實際上意味著什麼以及如何達到這個目標。

「GPT 包裝器」問題，直白地說

你用 Cursor 建立了一個應用程式。也許是內容寫作工具、客戶支援機器人，或是小眾行業助理。核心價值是 AI 功能。用戶註冊是因為 AI 能做有用的事情。

但問題是：這個 AI 不屬於你。它是 OpenAI 的 GPT-4o（或 Anthropic 的 Claude，或 Google 的 Gemini）。你是按 token 租用智能。

這造成了三個問題：

問題一：沒有定價控制。 當 OpenAI 設定每個 token 的價格，他們就是在設定你的利潤。如果他們漲價，你的利潤就縮水。你無法談判。你無法優化。你只能付錢。

問題二：沒有差異化。 你的競爭對手可以使用相同的模型和相同的 API。你的產品和他們的產品之間唯一的分隔是提示詞和使用者介面。提示詞可以被複製。介面可以被克隆。沒有可防禦的護城河。

問題三：沒有持續性保證。 OpenAI 棄用了 GPT-3.5 微調。他們定期淘汰舊版模型。如果他們棄用你的應用程式所依賴的模型，你就得忙著遷移——而新模型的行為可能不一樣。

這些不是邊緣案例。它們是 API 依賴模式中內建的結構性風險。

「模型所有權」的實際含義

讓我們解開這個謎團。模型所有權不是指：

從頭訓練模型（那需要數百萬美元）
成為機器學習研究員
建立你自己的 GPU 集群
理解 Transformer 架構的內部機制

模型所有權的含義是：

你拿一個開源基礎模型（Llama、Qwen、Phi）
你在你的資料上微調它——你的應用程式實際產生的輸入和輸出
你將它匯出為一個你可以下載和保存的檔案（GGUF 格式）
你在自己的基礎設施上運行它（帶有 Ollama 的 VPS）

結果：你伺服器上的一個模型檔案，能很好地完成你的任務。你擁有這個檔案。你擁有這些權重。沒有人可以棄用它、漲價或奪走它。你可以複製它、備份它、將它移到不同的硬體上，或在多台伺服器上分享它。

這就是所有權。不是比喻意義上的所有權。一個你持有和控制的實際檔案。

當 OpenAI 棄用你的模型時會發生什麼

這已經發生過多次。模式如下：

OpenAI 宣布新的模型版本
他們為舊版本設定棄用日期（通常是 6–12 個月後）
開發者忙著用現有提示詞測試新版本
新版本的行為不同——輸出改變、格式轉移、邊緣案例中斷
開發者花幾週時間調整提示詞以匹配舊行為
有些應用程式從未完全恢復

最具破壞性的棄用是 GPT-3.5-turbo 系列。已為 gpt-3.5-turbo-0613 仔細調整提示詞的應用程式，突然不得不遷移到以不同方式處理指令的新版本。幾個月來完美運行的系統提示開始產生錯誤輸出。

API 上使用微調模型的人處境更糟。他們的微調模型與基礎模型版本綁定。當基礎版本棄用時，他們的微調模型變得無法使用。他們不得不在新基礎上重新微調——這意味著新的行為、新的錯誤、新的提示工程週期。

對於你擁有的模型？這些都不會發生。你的 GGUF 檔案不會過期。明年和後年，Llama 3.3 8B 在 Ollama 中仍然能用。沒有棄用通知。沒有遷移截止日期。沒有你沒有選擇的行為改變。

當他們漲價時會發生什麼

OpenAI 的定價總體上呈下降趨勢，這讓人們自滿。但這個趨勢不是保證的，而且它掩蓋了一個更微妙的問題：他們為自己的收入優化定價，而不是為你的利潤。

以下是獨立應用程式面對定價壓力的情況：

你以 GPT-4o 每百萬輸入 token 2.50 美元的價格建立應用程式
你根據該成本結構設定訂閱價格
六個月後，你有了 5,000 個用戶，你的提示詞模式已經演變
你每個請求的平均 token 使用量悄悄增加了 40%（更長的對話、更多的上下文）
你每次互動的有效成本現在比你設定價格時高 40%
但你無法在不流失用戶的情況下提高訂閱價格

這幾乎發生在每個 AI 應用程式上。使用模式演變。提示詞變長。功能變複雜。按 token 計費的模式懲罰你改善產品。

固定成本 VPS 上的微調模型沒有這個問題。無論用戶發送短提示詞還是長提示詞，你的成本都一樣。無論你改善提示詞還是添加上下文視窗，你的成本都一樣。計費器不在運轉。

GGUF 優勢：真正的可攜性

當你將微調模型匯出為 GGUF 檔案時，你得到了一些非凡的東西：一個可以在任何地方運行的模型。

Ollama 在 Linux VPS 上——最常見的生產設置
llama.cpp 以獲得最高性能和控制
LM Studio 在你的 Mac 上用於開發和測試
Jan 提供好看的桌面介面
任何未來支援 GGUF 標準的工具

這與供應商鎖定完全相反。如果 Ollama 明天消失，你把 GGUF 加載到 llama.cpp 中。如果你想從 Hetzner 切換到 AWS，你複製這個檔案。如果你想在你的筆記型電腦上本地運行模型進行開發，你下載它。

你的模型是可攜的資產。它跟著你走。

與在 OpenAI 平台上的微調模型相比。它在哪裡？在 OpenAI 的伺服器上。你能下載它嗎？不能。你能在其他地方運行它嗎？不能。如果你停止支付 OpenAI，你能使用它嗎？不能。這不是你的模型。這是 OpenAI 的模型，你付費進行了定制。

模型所有權如何建立護城河

讓我們談談競爭優勢。

現在，任何人都可以建立 GPT-4o 包裝器。進入壁壘為零。如果你的應用程式的價值是「我們使用 GPT-4o 並且有好看的介面」，競爭對手可以在週末複製這個。他們確實擁有相同的 AI。

微調模型改變了這個等式：

你的模型在你的資料上訓練。 如果你建立了一個法律文件助理，你的模型已經看過你用戶數千份實際的法律文件，以及你的用戶偏好的特定輸出格式。你的競爭對手沒有相同的資料就無法複製這個。

你的模型隨使用而改善。 隨著你收集更多用戶資料，你的模型變得更好。這創造了飛輪效應：更好的模型 → 更多用戶 → 更多資料 → 更好的模型。你的競爭對手從零開始。

你的模型擁有你的領域知識。 在醫療帳單代碼上微調的模型知道 GPT-4o 不知道的醫療帳單代碼相關知識。它整體上不更聰明——它在你的特定事物上更聰明。這種專業化是你的護城河。

你的模型的行為是一致的。 你控制權重。今天的模型行為與六個月後的行為相同。你的用戶可以依賴一致的行為。你在 API 上的競爭對手無法保證這一點——下一次模型更新可能會改變一切。

這是在沙土上建造和在基岩上建造的區別。表面上看起來一樣。其中一個能在風暴中存活下來。

實際路徑：一個週末從 API 消費者到模型擁有者

以下是具體的時間表：

週五晚上（2 小時）

匯出你的訓練資料。 瀏覽過去 30–60 天的 API 日誌。提取你核心 AI 功能的輸入-輸出對。格式化為 JSONL。你至少需要 1,500 個示例——在典型的應用程式流量下，這是幾天的日誌量。

清洗資料。 移除不良示例（錯誤、幻覺、用戶投訴）。移除異常值。保留代表你希望模型做什麼的示例。這是最重要的步驟——垃圾進，垃圾出。

上傳到 Ertas Vault。 建立資料集。上傳你的 JSONL 檔案。

週六上午（3 小時）

開始訓練運行。 選擇 Llama 3.3 8B 作為基礎模型。使用 LoRA 默認值（秩 16，學習率 2e-4，3 個 epoch）。點擊訓練。

在訓練運行期間（約 60 分鐘）： 設置你的 VPS。啟動一個 Hetzner CAX31（32 GB ARM，約每月 16 美元）。安裝 Ollama。配置防火牆規則。如果你想要 HTTPS，用 nginx 設置反向代理。

評估你的模型。 訓練完成後，在 Ertas Studio 中檢查評估指標。從你應用程式的實際使用模式運行測試提示詞。將輸出與 GPT-4o 的輸出進行比較。

週六下午（2 小時）

匯出並部署。 將你的模型匯出為 GGUF（Q5_K_M 量化）。上傳到你的 VPS。建立 Ollama Modelfile。加載它。測試 API 端點。

整合測試。 將你應用程式的開發環境指向你的 VPS。執行你的核心用戶流程。驗證輸出是好的。

週日（2 小時）

部署。 更新你的生產應用程式配置以使用你的 VPS 端點。部署。在最初幾小時內監控。

設置備援方案。 配置你的應用程式，在你的 VPS 無響應時（維護、高負載等）回退到 OpenAI API。

總時間：週末大約 9 小時。持續的月成本：約 30–50 美元。你現在擁有了你的 AI。

為何這對退出價值很重要

如果你從長遠考慮——出售你的應用程式、籌集資金，或建立有持久價值的東西——模型所有權非常重要。

收購方看你的應用程式會看到兩件截然不同的事情：

依賴 API 的應用程式： 收入進來，API 成本出去。利潤稀薄且不可預測。核心技術不被擁有——它是被租用的。如果 API 改變，切換成本很高。結論：脆弱。

擁有模型的應用程式： 收入進來，基礎設施成本固定且低廉。有一個代表真實資產的專有訓練模型——訓練資料、嵌入在權重中的專業知識、部署基礎設施。沒有相同資料的競爭對手無法複製這個。結論：可防禦。

風險投資人和收購方越來越多地問：「你擁有什麼？」一個在獨特資料上訓練的微調模型是真實的答案。「我們使用 OpenAI API」不是。

所有權心態

Vibe coding 是關於快速發布。模型所有權是關於建立持久的東西。

這些並不矛盾。你可以在週末在 OpenAI API 上發布你的 MVP——你應該這樣做。但一旦你有了產品市場契合度和真實用戶，下一步就很清楚了：拿出你的用戶正在產生的資料，微調你自己的模型，停止依賴別人的基礎設施作為你的核心價值。

你應用程式的 AI 應該屬於你。不是因為這在意識形態上是純粹的，而是因為它對你的成本、你的用戶、你的競爭地位，以及你建立一個能夠存活的業務的能力更好。

停止使用他人的模型。使用你自己的。

Ship AI that runs on your users' devices.

Free plan with 30 credits/mo, no card required. Paid plans from $25/mo USD.

or view pricing →