Back to blog
    Anthropic 剛剛揭露了 AI 中最大的問題:您不擁有您的模型
    model-ownershipdistillationvendor-lock-inai-strategydeepseekanthropic

    Anthropic 剛剛揭露了 AI 中最大的問題:您不擁有您的模型

    Anthropic 發現 DeepSeek、Moonshot 和 MiniMax 使用 24,000 個帳戶提煉 Claude。真正的教訓不是關於中國 AI 實驗室——而是關於當您在不屬於您的 AI 上構建時會發生什麼。

    EErtas Team·

    2026 年 2 月 23 日,Anthropic 發表了一篇在整個科技行業引起轟動的博客文章。該公司檢測到三家中國 AI 實驗室對 Claude 進行了所謂「工業規模蒸餾攻擊」:DeepSeek、Moonshot AI 和 MiniMax。

    數字令人震驚。超過 24,000 個欺詐帳戶。超過 1,600 萬次與 Claude 的交流。三個獨立的行動,每個針對不同的能力,同時在 Anthropic 的平台上運行。

    大多數報道將此框架為中國公司從美國 AI 實驗室竊取的故事。這個框架是不完整的。更深層的故事是關於一個影響今天每個使用 AI 構建的企業的結構性問題——包括您的企業。

    實際發生了什麼

    以下是 Anthropic 報告的事實。

    DeepSeek 與 Claude 進行了超過 150,000 次交流。他們的查詢針對推理任務、適合訓練強化學習獎勵模型的基於規則的評分,以及對政治敏感內容的規避審查改寫。這種模式是系統性的——旨在提取特定能力,可以直接輸入他們自己的訓練管線。

    Moonshot AI(Kimi 背後的公司)更具進攻性,佔超過 340 萬次交流。他們的重點:代理推理、工具使用、編碼、數據分析、計算機使用代理和計算機視覺。本質上,他們是在挖掘 Claude 的使 AI 代理有用的能力。

    MiniMax 驅動了最多的量——超過 1,300 萬次交流。在這種規模下,「大量使用」和「系統性提取」之間的界限開始模糊,這正是問題所在。

    所有三家公司都通過設計來避免偵測的帳戶網路路由其活動。Anthropic 的安全團隊通過行為分析識別了這些行動,通過使用模式、查詢結構和訪問時間將帳戶連結起來。

    蒸餾實際上是什麼

    在進一步討論之前,有必要了解模型蒸餾是什麼——因為它本身並不是惡意的。

    蒸餾是一種標準的機器學習技術。您取一個大型「教師」模型,使用其輸出來訓練一個較小的「學生」模型。學生學習以很少的計算成本近似教師的行為。它最初在 Geoffrey Hinton 2015 年的論文中描述,每個主要 AI 實驗室都在內部使用它。

    OpenAI 蒸餾自己的模型以創建更便宜的變體。Anthropic 也一樣。Meta 發布 Llama 3 專門是為了讓開源社區能夠基於它構建——包括通過蒸餾。這種技術是 AI 行業運作方式的基礎。

    爭議不在於技術。而在於來源。

    媒體遺漏的細微之處

    以下是報道變得有趣的地方——也是大多數媒體停止的地方。

    這些公司為他們的帳戶付費。他們使用了 API。他們收到了輸出。他們遵循了每天數百萬其他客戶遵循的技術流程。不同之處在於他們用這些輸出做了什麼:他們將其用作自己模型的訓練數據。

    值得注意的是 Anthropic 自己的條款如何框架這一點。一方面,Anthropic 將輸出所有權分配給客戶——其條款聲明:「我們將我們所有的權利、所有權和利益——如果有的話——在輸出中分配給您。」您為 API 調用付費。您擁有返回的內容。另一方面,Anthropic 的使用政策明確禁止「在沒有事先授權的情況下利用輸入和輸出訓練 AI 模型」。不僅僅是競爭性模型——而是任何 AI 模型。

    Anthropic 關於此事件的博客文章在措辭上是謹慎的。他們承認蒸餾是「廣泛使用且合法的訓練方法」,前沿實驗室「常規蒸餾自己的模型」。正如 Anthropic 所框架的,違規是合同性的——服務條款違反——而不是刑事盜竊,儘管許多頭條標題如此定性。

    但「使用」和「蒸餾」之間的界限比頭條標題所暗示的更模糊。考慮這個進展:

    • 一家 SaaS 公司整合 Claude 為其應用程序中的客戶支持功能提供支持。這是按預期目的使用 API。明確允許的。
    • 同一家公司記錄所有 Claude 響應以分析模式並改進其產品。仍然是標準做法。仍然允許的。
    • 同一家公司意識到他們可以在這些記錄的輸出上微調一個小模型以減少延遲並降低成本。現在他們技術上違反了使用政策。

    在所有三種情況下,公司都在做同樣的事情:使用 API 輸出實現其業務目標。他們不是在構建競爭性 AI 實驗室。他們不是在提取前沿能力。他們只是一個試圖更好地服務用戶的 SaaS 團隊。

    這不是假設的邊緣案例。現在有數千個團隊正在使用前沿 API 輸出來合成訓練數據集——不是為了與 Anthropic 或 OpenAI 競爭,而是為了為其產品中的一個窄任務構建輕量級模型。分類器。提取器。格式化器。

    服務條款不區分 DeepSeek 在工業規模上系統性地蒸餾 Claude,以及一個五人初創公司在記錄的 API 響應上微調 7B 模型。兩者技術上都需要事先授權。但只有一個上了頭條。

    這種張力揭示了行業尚未完全解決的事情:當您銷售 API 訪問並分配輸出所有權,但限制這些擁有的輸出如何用於 AI 訓練時,您就在創建一種存在內在摩擦的關係。 每個依賴 AI API 的企業都應該了解這種摩擦的位置——因為隨著 AI 驅動的產品成熟,「使用」和「訓練」輸出之間的界限只會越來越模糊。

    真正的教訓:這就是供應商依賴在規模上的樣子

    剝去地緣政治和法律問題。這裡實際發生了什麼?

    三家公司——合計估值數十億美元,擁有數千名工程師——確定通往他們所需 AI 能力的最快路徑是從別人的平台提取這些能力。

    他們不缺人才。他們不缺計算能力。他們不缺雄心。他們所缺乏的是對他們想要的特定能力的所有權。所以他們去從 Anthropic 的 API 租用了它——在工業規模上。

    這就是供應商依賴。只是大多數企業在較小的規模上體驗它。

    當您的 AI 驅動支持機器人完全依賴於 OpenAI 的 API 時,您處於與 DeepSeek 相同的結構位置——只是帳戶更少。您不擁有模型。您不控制能力。您無法取走您構建的智能並將其移動到其他地方。

    讓它更糟的是:與 DeepSeek 不同,您可能沒有訪問被撤銷時的計劃。

    為什麼這對您的業務很重要

    您可能在想:「我們沒有蒸餾模型。我們只是使用 API。這不適用於我們。」

    它適用。原因如下。

    相同的依賴風險在每個規模上都存在。 如果您的產品依賴於 Claude 或 GPT-4,您距離中斷只有一次政策變更。Anthropic 一夜之間封禁了 24,000 個帳戶。OpenAI 在大約兩週通知後棄用了 GPT-4o。Assistants API——數千名開發者在其上構建了生產系統——正在日落。這些不是假設的。它們是近期歷史。

    您的競爭地位是借來的,不是構建的。 如果您在雲端 API 之上構建 AI 功能,您的差異化是您的提示工程和工作流——而不是您的模型。這意味著任何註冊相同 API 的競爭對手都可以近似您提供的內容。您正處於已經使 AI 機構商品化的同一個GPT 包裝器陷阱中。

    您的成本由別人控制。 按 token 定價意味著您的 AI 費用是可變且不可預測的。來自客戶促銷的使用量峰值可能在一週內抹去您的利潤率。當供應商決定提高價格——或棄用您已優化的模型——您承擔適應成本,沒有談判空間。

    您的數據流經別人的基礎設施。 每次 API 調用都將您的數據——您客戶的數據——發送到第三方系統。對於受監管行業,這創造了隨著每項新法規增長的合規風險。對於其他所有人,這意味著您正在用您的使用模式訓練別人的模型,即使供應商說他們不使用您的數據進行訓練。

    如果您的業務依賴於您不擁有的 AI,您已經面臨風險。使用 Ertas 微調您自己的模型——不需要 ML 專業知識。加入等待名單 →

    模型所有權替代方案

    Anthropic/DeepSeek 的故事有一個顯而易見的解決方案:擁有您的模型

    不是在擁有 API 密鑰意義上的「擁有」。而是在持有實際模型權重、在您的數據上訓練、在您的基礎設施上運行、在您的控制下的意義上擁有。

    以下是實際情況:

    從開源基礎模型開始。 Llama 3、Qwen 2.5、Mistral——這些是具有寬鬆許可的生產品質模型。Meta 明確允許在適當歸屬的情況下蒸餾 Llama。您沒有違反任何人的服務條款。您不依賴任何人的 API。您在自己的硬體上擁有權重。

    在您的領域數據上微調。 取該基礎模型並在您的特定用例上微調它。您的客戶支持日誌。您的產品文件。您的銷售對話。您的合規要求。由此產生的模型不僅僅近似通用智能——它開發了您業務獨特的能力。

    匯出並在任何地方部署。 匯出到 GGUF 格式,並在 Ollama、llama.cpp、LM Studio 或任何兼容的推理引擎上運行。您的模型在您的硬體上運行。沒有 API 調用。沒有按 token 的費用。沒有可以棄用您的模型或更改規則的供應商。

    經濟上很有說服力。在 API 調用上運行 15 個客戶的機構通常每月花費 AU$4,200。相同的工作負載在每個客戶微調的 LoRA 適配器上費用低於每月 AU$15——減少 99.6%。從 100 個用戶擴展到 40,000 個用戶的獨立開發者看到他們的 API 賬單從每月 12 美元增長到 3,000 美元。使用微調的本地模型,費用幾乎保持不變。

    但經濟上實際上是次要的好處。主要好處是:沒有人可以拿走您的模型

    沒有供應商可以棄用它。沒有服務條款變更可以使其失效。沒有帳戶封禁可以關閉它。沒有定價變更可以使其負擔不起。它是您的。

    「擁有您的 AI」實際上看起來像什麼

    模型所有權不是全有或全無的。您不必明天就拔掉每個 API 調用。實際路徑看起來更像這樣:

    第一階段:識別您最高量、最可預測的 AI 任務。 這些是您的微調候選者。輸入/輸出格式一致、有可用訓練數據、您正在支付大量按 token 費用的任務。客戶支持分類、以特定格式生成內容、從結構化文件提取數據。

    第二階段:為一個任務微調一個模型。 使用您現有的 API 日誌作為訓練數據。微調一個 7B 或 14B 參數模型。將品質與您當前的基於 API 的解決方案進行比較。對於特定領域的任務,微調模型一致達到 90-95% 的準確率——通常匹配或超過提示工程的前沿模型。

    第三階段:並行部署。 在測試期間同時運行您的微調模型和 API。將一定百分比的流量路由到本地模型。驗證品質。衡量成本節省。建立信心。

    第四階段:擴展。 一旦一個任務在您自己的模型上運行,為下一個重複這個過程。在 90 天內,您可以將最關鍵的 AI 工作負載從租用遷移到擁有。

    執行此操作的工具已經存在。開源模型是生產品質的。LoRA 微調足夠高效,可以在消費級 GPU 上運行。GGUF 匯出意味著您的模型跨推理引擎是可攜帶的。

    障礙從未是技術可行性。而是可訪問性——對於沒有 ML 專業知識的團隊,「理論上可能」和「實際上可實現」之間的差距。

    這是 Ertas 旨在彌合的差距。整個管線的視覺界面:上傳您的數據集、微調模型、並排比較結果、匯出到 GGUF。不需要 Python。不需要 YAML 配置。不需要 CLI。大約兩分鐘即可設置。

    真正的啟示

    Anthropic/DeepSeek 的故事將被爭論數月。地緣政治、法律問題、國家安全影響——這些都是真實且重要的對話。

    但對於構建者、創始人、機構所有者和產品團隊,啟示更簡單:

    如果您在不控制的 AI 上構建,您就在別人的條款上構建。 這些條款可以隨時改變。通往真正 AI 獨立性的唯一路徑是模型所有權——在您的數據上訓練的模型,在您的基礎設施上運行,由您擁有。

    DeepSeek 必須創建 24,000 個假帳戶,因為他們不擁有他們所需的能力。您有一個更好的選擇:在開源基礎上,用您自己的數據,自己構建這些能力。

    技術存在。經濟上可行。唯一的問題是您等多久才開始。


    停止租用您的 AI。以早鳥定價預訂 Ertas,從第一天起就擁有您的模型。Builder 等級終身鎖定在每月 14.50 美元。查看定價 →

    Ship AI that runs on your users' devices.

    Early bird pricing starts at $14.50/mo — locked in for life. Plans for builders and agencies.

    Keep reading