Back to blog
    停止使用他人的模型:Vibecoder 走向 AI 所有權之路
    model-ownershipmoatindie-devvibe-codingsegment:vibecoder

    停止使用他人的模型:Vibecoder 走向 AI 所有權之路

    每個使用 OpenAI API 的應用程式都距離虧損只差一次漲價。模型所有權——訓練並自行部署你的模型——才是建立持久 AI 產品的方式。

    EErtas Team·

    有一個問題應該讓你感到不安:如果 OpenAI 明天把價格翻倍,你的應用程式會怎樣?

    如果答案是「我的利潤會蒸發」或「我不得不關閉 AI 功能」,那麼你沒有 AI 產品。你有的是別人 AI 產品的包裝器。而那個「別人」掌控著你的經濟狀況。

    這不是假設性的末日預言。OpenAI 之前已經棄用過模型。他們改變過定價結構。他們也調整過頻率限制。每次他們這樣做,數千個應用程式都在忙著調整。有些活不下去。

    模型所有權——在你的資料上訓練模型並自行部署——才是建立持久產品的方式。讓我們談談這實際上意味著什麼以及如何達到這個目標。

    「GPT 包裝器」問題,直白地說

    你用 Cursor 建立了一個應用程式。也許是內容寫作工具、客戶支援機器人,或是小眾行業助理。核心價值是 AI 功能。用戶註冊是因為 AI 能做有用的事情。

    但問題是:這個 AI 不屬於你。它是 OpenAI 的 GPT-4o(或 Anthropic 的 Claude,或 Google 的 Gemini)。你是按 token 租用智能。

    這造成了三個問題:

    問題一:沒有定價控制。 當 OpenAI 設定每個 token 的價格,他們就是在設定你的利潤。如果他們漲價,你的利潤就縮水。你無法談判。你無法優化。你只能付錢。

    問題二:沒有差異化。 你的競爭對手可以使用相同的模型和相同的 API。你的產品和他們的產品之間唯一的分隔是提示詞和使用者介面。提示詞可以被複製。介面可以被克隆。沒有可防禦的護城河。

    問題三:沒有持續性保證。 OpenAI 棄用了 GPT-3.5 微調。他們定期淘汰舊版模型。如果他們棄用你的應用程式所依賴的模型,你就得忙著遷移——而新模型的行為可能不一樣。

    這些不是邊緣案例。它們是 API 依賴模式中內建的結構性風險。

    「模型所有權」的實際含義

    讓我們解開這個謎團。模型所有權不是指:

    • 從頭訓練模型(那需要數百萬美元)
    • 成為機器學習研究員
    • 建立你自己的 GPU 集群
    • 理解 Transformer 架構的內部機制

    模型所有權的含義是:

    1. 你拿一個開源基礎模型(Llama、Qwen、Phi)
    2. 你在你的資料上微調它——你的應用程式實際產生的輸入和輸出
    3. 你將它匯出為一個你可以下載和保存的檔案(GGUF 格式)
    4. 你在自己的基礎設施上運行它(帶有 Ollama 的 VPS)

    結果:你伺服器上的一個模型檔案,能很好地完成你的任務。你擁有這個檔案。你擁有這些權重。沒有人可以棄用它、漲價或奪走它。你可以複製它、備份它、將它移到不同的硬體上,或在多台伺服器上分享它。

    這就是所有權。不是比喻意義上的所有權。一個你持有和控制的實際檔案。

    當 OpenAI 棄用你的模型時會發生什麼

    這已經發生過多次。模式如下:

    1. OpenAI 宣布新的模型版本
    2. 他們為舊版本設定棄用日期(通常是 6–12 個月後)
    3. 開發者忙著用現有提示詞測試新版本
    4. 新版本的行為不同——輸出改變、格式轉移、邊緣案例中斷
    5. 開發者花幾週時間調整提示詞以匹配舊行為
    6. 有些應用程式從未完全恢復

    最具破壞性的棄用是 GPT-3.5-turbo 系列。已為 gpt-3.5-turbo-0613 仔細調整提示詞的應用程式,突然不得不遷移到以不同方式處理指令的新版本。幾個月來完美運行的系統提示開始產生錯誤輸出。

    API 上使用微調模型的人處境更糟。他們的微調模型與基礎模型版本綁定。當基礎版本棄用時,他們的微調模型變得無法使用。他們不得不在新基礎上重新微調——這意味著新的行為、新的錯誤、新的提示工程週期。

    對於你擁有的模型?這些都不會發生。你的 GGUF 檔案不會過期。明年和後年,Llama 3.3 8B 在 Ollama 中仍然能用。沒有棄用通知。沒有遷移截止日期。沒有你沒有選擇的行為改變。

    當他們漲價時會發生什麼

    OpenAI 的定價總體上呈下降趨勢,這讓人們自滿。但這個趨勢不是保證的,而且它掩蓋了一個更微妙的問題:他們為自己的收入優化定價,而不是為你的利潤。

    以下是獨立應用程式面對定價壓力的情況:

    • 你以 GPT-4o 每百萬輸入 token 2.50 美元的價格建立應用程式
    • 你根據該成本結構設定訂閱價格
    • 六個月後,你有了 5,000 個用戶,你的提示詞模式已經演變
    • 你每個請求的平均 token 使用量悄悄增加了 40%(更長的對話、更多的上下文)
    • 你每次互動的有效成本現在比你設定價格時高 40%
    • 但你無法在不流失用戶的情況下提高訂閱價格

    這幾乎發生在每個 AI 應用程式上。使用模式演變。提示詞變長。功能變複雜。按 token 計費的模式懲罰你改善產品。

    固定成本 VPS 上的微調模型沒有這個問題。無論用戶發送短提示詞還是長提示詞,你的成本都一樣。無論你改善提示詞還是添加上下文視窗,你的成本都一樣。計費器不在運轉。

    GGUF 優勢:真正的可攜性

    當你將微調模型匯出為 GGUF 檔案時,你得到了一些非凡的東西:一個可以在任何地方運行的模型。

    • Ollama 在 Linux VPS 上——最常見的生產設置
    • llama.cpp 以獲得最高性能和控制
    • LM Studio 在你的 Mac 上用於開發和測試
    • Jan 提供好看的桌面介面
    • 任何未來支援 GGUF 標準的工具

    這與供應商鎖定完全相反。如果 Ollama 明天消失,你把 GGUF 加載到 llama.cpp 中。如果你想從 Hetzner 切換到 AWS,你複製這個檔案。如果你想在你的筆記型電腦上本地運行模型進行開發,你下載它。

    你的模型是可攜的資產。它跟著你走。

    與在 OpenAI 平台上的微調模型相比。它在哪裡?在 OpenAI 的伺服器上。你能下載它嗎?不能。你能在其他地方運行它嗎?不能。如果你停止支付 OpenAI,你能使用它嗎?不能。這不是你的模型。這是 OpenAI 的模型,你付費進行了定制。

    模型所有權如何建立護城河

    讓我們談談競爭優勢。

    現在,任何人都可以建立 GPT-4o 包裝器。進入壁壘為零。如果你的應用程式的價值是「我們使用 GPT-4o 並且有好看的介面」,競爭對手可以在週末複製這個。他們確實擁有相同的 AI。

    微調模型改變了這個等式:

    你的模型在你的資料上訓練。 如果你建立了一個法律文件助理,你的模型已經看過你用戶數千份實際的法律文件,以及你的用戶偏好的特定輸出格式。你的競爭對手沒有相同的資料就無法複製這個。

    你的模型隨使用而改善。 隨著你收集更多用戶資料,你的模型變得更好。這創造了飛輪效應:更好的模型 → 更多用戶 → 更多資料 → 更好的模型。你的競爭對手從零開始。

    你的模型擁有你的領域知識。 在醫療帳單代碼上微調的模型知道 GPT-4o 不知道的醫療帳單代碼相關知識。它整體上不更聰明——它在你的特定事物上更聰明。這種專業化是你的護城河。

    你的模型的行為是一致的。 你控制權重。今天的模型行為與六個月後的行為相同。你的用戶可以依賴一致的行為。你在 API 上的競爭對手無法保證這一點——下一次模型更新可能會改變一切。

    這是在沙土上建造和在基岩上建造的區別。表面上看起來一樣。其中一個能在風暴中存活下來。

    實際路徑:一個週末從 API 消費者到模型擁有者

    以下是具體的時間表:

    週五晚上(2 小時)

    匯出你的訓練資料。 瀏覽過去 30–60 天的 API 日誌。提取你核心 AI 功能的輸入-輸出對。格式化為 JSONL。你至少需要 1,500 個示例——在典型的應用程式流量下,這是幾天的日誌量。

    清洗資料。 移除不良示例(錯誤、幻覺、用戶投訴)。移除異常值。保留代表你希望模型做什麼的示例。這是最重要的步驟——垃圾進,垃圾出。

    上傳到 Ertas Vault。 建立資料集。上傳你的 JSONL 檔案。

    週六上午(3 小時)

    開始訓練運行。 選擇 Llama 3.3 8B 作為基礎模型。使用 LoRA 默認值(秩 16,學習率 2e-4,3 個 epoch)。點擊訓練。

    在訓練運行期間(約 60 分鐘): 設置你的 VPS。啟動一個 Hetzner CAX31(32 GB ARM,約每月 16 美元)。安裝 Ollama。配置防火牆規則。如果你想要 HTTPS,用 nginx 設置反向代理。

    評估你的模型。 訓練完成後,在 Ertas Studio 中檢查評估指標。從你應用程式的實際使用模式運行測試提示詞。將輸出與 GPT-4o 的輸出進行比較。

    週六下午(2 小時)

    匯出並部署。 將你的模型匯出為 GGUF(Q5_K_M 量化)。上傳到你的 VPS。建立 Ollama Modelfile。加載它。測試 API 端點。

    整合測試。 將你應用程式的開發環境指向你的 VPS。執行你的核心用戶流程。驗證輸出是好的。

    週日(2 小時)

    部署。 更新你的生產應用程式配置以使用你的 VPS 端點。部署。在最初幾小時內監控。

    設置備援方案。 配置你的應用程式,在你的 VPS 無響應時(維護、高負載等)回退到 OpenAI API。

    總時間:週末大約 9 小時。持續的月成本:約 30–50 美元。你現在擁有了你的 AI。

    為何這對退出價值很重要

    如果你從長遠考慮——出售你的應用程式、籌集資金,或建立有持久價值的東西——模型所有權非常重要。

    收購方看你的應用程式會看到兩件截然不同的事情:

    依賴 API 的應用程式: 收入進來,API 成本出去。利潤稀薄且不可預測。核心技術不被擁有——它是被租用的。如果 API 改變,切換成本很高。結論:脆弱。

    擁有模型的應用程式: 收入進來,基礎設施成本固定且低廉。有一個代表真實資產的專有訓練模型——訓練資料、嵌入在權重中的專業知識、部署基礎設施。沒有相同資料的競爭對手無法複製這個。結論:可防禦。

    風險投資人和收購方越來越多地問:「你擁有什麼?」一個在獨特資料上訓練的微調模型是真實的答案。「我們使用 OpenAI API」不是。

    所有權心態

    Vibe coding 是關於快速發布。模型所有權是關於建立持久的東西。

    這些並不矛盾。你可以在週末在 OpenAI API 上發布你的 MVP——你應該這樣做。但一旦你有了產品市場契合度和真實用戶,下一步就很清楚了:拿出你的用戶正在產生的資料,微調你自己的模型,停止依賴別人的基礎設施作為你的核心價值。

    你應用程式的 AI 應該屬於你。不是因為這在意識形態上是純粹的,而是因為它對你的成本、你的用戶、你的競爭地位,以及你建立一個能夠存活的業務的能力更好。

    停止使用他人的模型。使用你自己的。


    Ship AI that runs on your users' devices.

    Ertas early bird pricing starts at $14.50/mo — locked in for life. Plans for builders and agencies.

    延伸閱讀

    Ship AI that runs on your users' devices.

    Early bird pricing starts at $14.50/mo — locked in for life. Plans for builders and agencies.

    Keep reading