
Anthropic刚刚揭露了AI领域最大的问题:你不拥有自己的模型
Anthropic发现DeepSeek、Moonshot和MiniMax使用24,000个账户蒸馏Claude。真正的教训不是关于中国AI实验室——而是关于当你在不属于自己的AI上构建时会发生什么。
2026年2月23日,Anthropic发布了一篇在整个科技行业引起轰动的博文。该公司检测到三家中国AI实验室对Claude进行了所谓的"工业规模蒸馏攻击":DeepSeek、Moonshot AI和MiniMax。
数字令人震惊。超过24,000个欺诈账户。与Claude的超过1600万次交互。三个独立的活动,每个针对不同的能力,同时在Anthropic的平台上运行。
大多数报道将此定性为中国公司从美国AI实验室窃取的故事。这种框架是不完整的。更深层的故事是关于一个影响当今每个构建AI的企业的结构性问题——包括你的。
实际发生了什么
以下是Anthropic报告的事实。
DeepSeek与Claude产生了超过150,000次交互。他们的查询针对推理任务、适合训练强化学习奖励模型的基于评分标准的评估,以及对政治敏感内容的审查安全改写。这种模式是系统性的——旨在提取可以直接输入他们自己训练管道的特定能力。
Moonshot AI(Kimi背后的公司)更为激进,占超过340万次交互。他们的重点:智能体推理、工具使用、编码、数据分析、计算机使用代理和计算机视觉。本质上,他们在挖掘Claude中使AI代理有用的能力。
MiniMax产生了最大的流量——超过1300万次交互。在这个规模下,"大量使用「和」系统性提取"之间的界限开始模糊,这正是问题所在。
三家公司都通过旨在避免检测的账户网络来路由他们的活动。Anthropic的安全团队通过行为分析,将使用模式、查询结构和访问时间关联起来,识别了这些活动。
什么是蒸馏
在继续之前,值得了解模型蒸馏是什么——因为它本身并不是恶意的。
蒸馏是一种标准的机器学习技术。你取一个大型"教师「模型,使用其输出来训练一个较小的」学生"模型。学生学会以极小的计算成本近似教师的行为。它首次在Geoffrey Hinton 2015年的论文中描述,每个主要AI实验室都在内部使用它。
OpenAI蒸馏自己的模型以创建更便宜的变体。Anthropic也这样做。Meta发布Llama 3专门为了让开源社区在其上构建——包括通过蒸馏。这项技术是AI行业运作方式的基础。
争议不在于技术本身。而在于来源。
媒体遗漏的细微之处
这是报道变得有趣的地方——也是大多数媒体止步的地方。
这些公司为他们的账户付了费。他们使用了API。他们收到了输出。他们遵循了数百万其他客户每天遵循的技术流程。不同之处在于他们 对这些输出做了什么:他们将其用作训练自己模型的训练数据。
值得注意的是Anthropic自己的条款是如何框定这一点的。一方面,Anthropic将输出所有权分配给客户——他们的条款说明:"我们将我们在输出中的所有权利、所有权和利益(如果有的话)转让给你。「你为API调用付费。你拥有返回的内容。另一方面,Anthropic的使用政策明确禁止」利用输入和输出来训练AI模型",除非获得事先授权。不仅仅是竞争模型——任何AI模型。
Anthropic关于该事件的博文在措辞上很谨慎。他们承认蒸馏是"一种广泛使用且合法的训练方法「,并且前沿实验室」经常蒸馏自己的模型"。Anthropic框定的违规是合同性的——违反服务条款——而不是犯罪盗窃,尽管许多标题如此描述。
但"使用「和」蒸馏"之间的界限比标题暗示的更模糊。考虑这个渐进过程:
- 一家SaaS公司集成Claude来为其应用中的客户支持功能提供动力。这是按照API的预期目的使用。明显被允许。
- 同一家公司记录所有Claude响应以分析模式并改进产品。仍然是标准做法。仍然被允许。
- 同一家公司意识到他们可以在这些记录的输出上微调一个小模型以减少延迟和降低成本。现在他们在技术上违反了使用政策。
在所有三种情况下,公司都在做同样的事情:使用API输出来实现其业务目标。他们没有建立一个竞争性的AI实验室。他们没有提取前沿能力。他们只是一个试图更好地服务用户的SaaS团队。
这不是一个假设的边缘情况。现在有数千个团队正在使用前沿API输出来合成训练数据集——不是为了与Anthropic或OpenAI竞争,而是为了在他们的产品中为一个狭窄的任务构建轻量级模型。一个分类器。一个提取器。一个格式化器。
服务条款不区分DeepSeek工业规模系统性蒸馏Claude和一个五人初创公司在记录的API响应上微调7B模型。两者在技术上都需要事先授权。但只有一个上了头条。
这种紧张关系揭示了行业尚未完全解决的问题:**当你出售API访问权并分配输出所有权,但限制这些拥有的输出如何用于AI训练时,你正在创造一种具有固有摩擦的关系。**每个依赖AI API的企业都应该了解这种摩擦在哪里——因为"使用「和」基于输出训练"之间的边界只会随着AI产品的成熟变得更加模糊。
真正的教训:这就是供应商依赖大规模呈现的样子
去掉地缘政治和法律问题。这里实际发生了什么?
三家公司——总估值数十亿美元,拥有数千名工程师——确定获取他们需要的AI能力的最快途径是从别人的平台提取这些能力。
他们不缺人才。不缺计算力。不缺雄心。他们缺乏的是对他们想要的特定能力的所有权。所以他们去从Anthropic的API以工业规模租用了这些能力。
这就是供应商依赖。只是大多数企业在更小的规模上经历它。
当你的AI客服机器人完全依赖于OpenAI的API时,你与DeepSeek处于同样的结构性位置——只是账户更少。你不拥有模型。你不控制能力。你无法将你建立的智能带到其他地方。
更糟糕的是:与DeepSeek不同,你可能没有计划应对访问被撤销时会发生什么。
为什么这对你的企业很重要
你可能在想:"我们没有在蒸馏模型。我们只是在使用API。这不适用于我们。"
确实适用。原因如下。
**同样的依赖风险在每个规模上都存在。**如果你的产品依赖于Claude或GPT-4,你离被颠覆只有一个政策变更的距离。Anthropic一夜之间封禁了24,000个账户。OpenAI大约提前两周通知就废弃了GPT-4o。Assistants API——数千名开发者在其上构建了生产系统——正在被关闭。这些不是假设。它们是最近的历史。
**你的竞争地位是借来的,不是建立的。**如果你在云API之上构建AI功能,你的差异化在于你的提示工程和工作流——而不是你的模型。这意味着任何注册同一API的竞争对手都可以近似你的产品。你正处于已经在商品化AI机构的GPT包装器陷阱中。
**你的成本由别人控制。**按令牌定价意味着你的AI开支是可变的和不可预测的。客户促销带来的使用量激增可能在一周内抹掉你的利润。当提供商决定提价——或废弃你已优化的模型——你承担适应成本,没有谈判余地。
**你的数据流经别人的基础设施。**每次API调用都将你的数据——你客户的数据——发送到第三方系统。对于受监管行业来说,这造成了随着每项新法规增长的合规风险。对于其他所有人来说,这意味着你在用你的使用模式训练别人的模型,即使提供商说他们不使用你的数据进行训练。
如果你的企业依赖于你不拥有的AI,你已经处于风险之中。用Ertas微调你自己的模型——不需要ML专业知识。加入候补名单 →
模型所有权替代方案
Anthropic/DeepSeek的故事有一个隐藏在显而易见处的直截了当的解决方案:拥有你的模型。
不是"拥有"API密钥意义上的拥有。而是拥有实际的模型权重,用你的数据训练,在你的基础设施上运行,在你的控制之下。
实践中是这样的:
从开源基础模型开始。 Llama 3、Qwen 2.5、Mistral——这些是具有宽松许可证的生产质量模型。Meta明确允许在适当归属的情况下蒸馏Llama。你没有违反任何人的服务条款。你不依赖于任何人的API。你拥有自己硬件上的权重。
**在你的领域数据上微调。**取那个基础模型,在你的特定用例上微调它。你的客户支持记录。你的产品文档。你的销售对话。你的合规要求。生成的模型不只是近似通用智能——它发展出你企业独有的能力。
**导出并部署到任何地方。**导出为GGUF格式,在Ollama、llama.cpp、LM Studio或任何兼容的推理引擎上运行。你的模型在你的硬件上运行。没有API调用。没有按令牌成本。没有可以废弃你模型或改变规则的供应商。
经济性很有说服力。在API调用上运行15个客户的机构通常每月花费AU$4,200。每客户微调LoRA适配器上的相同工作量每月不到AU$15——降低99.6%。从100扩展到40,000用户的独立开发者看到他们的API账单从12美元/月增长到3,000美元/月。使用微调的本地模型,成本基本保持不变。
但经济性实际上是次要的好处。主要好处是:没有人可以拿走你的模型。
没有提供商可以废弃它。没有服务条款变更可以使其无效。没有账户封禁可以关闭它。没有定价变更可以使其负担不起。它是你的。
"拥有你的AI"实际是什么样子
模型所有权不是非此即彼的。你不必明天就删除每个API调用。实际路径更像这样:
**阶段1:识别你最高流量、最可预测的AI任务。**这些是你的微调候选。输入/输出格式一致、有可用训练数据、并且你正在支付大量按令牌成本的任务。客户支持分类、特定格式的内容生成、从结构化文档中提取数据。
**阶段2:为一个任务微调模型。**使用你现有的API日志作为训练数据。微调一个7B或14B参数模型。将质量与你当前基于API的解决方案进行比较。对于领域特定任务,微调模型持续达到90-95%的准确率——通常与提示工程前沿模型的表现持平或超越。
**阶段3:并行部署。**将微调模型与API并行运行一段测试期。将一定百分比的流量路由到本地模型。验证质量。测量成本节约。建立信心。
**阶段4:扩展。**一旦一个任务在你自己的模型上运行,对下一个任务重复此过程。在90天内,你可以将最关键的AI工作负载从租用迁移到拥有。
做到这一点的工具已经存在。开源模型达到了生产质量。LoRA微调高效到可以在消费级GPU上运行。GGUF导出意味着你的模型可以在推理引擎之间移植。
障碍从来不是技术可行性。而是可及性——对于没有ML专业知识的团队来说,"理论上可能「和」实际上可实现"之间的差距。
这就是Ertas旨在弥合的差距。一个可视化界面覆盖整个管道:上传数据集、微调模型、并排比较结果、导出为GGUF。不需要Python。不需要YAML配置。不需要CLI。大约两分钟内设置完成。
真正的要点
Anthropic/DeepSeek的故事将被争论数月。地缘政治、法律问题、国家安全影响——这些是真实而重要的对话。
但对于构建者、创始人、机构所有者和产品团队来说,要点更简单:
**如果你在你不控制的AI上构建 ,你就是在别人的条款上构建。**这些条款可以随时改变。通往真正AI独立的唯一路径是模型所有权——用你的数据训练、在你的基础设施上运行、由你拥有的模型。
DeepSeek必须创建24,000个假账户,因为他们不拥有他们需要的能力。你有更好的选择:在开源基础上,用你自己的数据,自己构建这些能力。
技术存在。经济性可行。唯一的问题是你等多久才开始。
停止租用你的AI。以早鸟价格预订Ertas,从第一天起拥有你的模型。Builder层终身锁定在$14.50/月。查看定价 →
Ship AI that runs on your users' devices.
Early bird pricing starts at $14.50/mo — locked in for life. Plans for builders and agencies.