
模型蒸馏不是盗窃——但以下是为什么你应该自己做
模型蒸馏是合法的ML技术——每个主要实验室都在用。DeepSeek事件是合同违约而非盗窃。以下是为什么在开源模型上用自己的数据微调是伦理、合法且战略上正确的路径。
"蒸馏"一夜之间变得有争议。DeepSeek使用24,000个账户系统性地提取Claude的能力后,这项技术在标题中被定性为间谍和盗窃之间的行为。
这种定性具有误导性。蒸馏是机器学习中使用最广泛的技术之一。问题不在方法——而在你把它指向哪里。
合法性光谱
级别1:开源到开源(完全许可) — Llama 70B输出训练Llama 7B变体。Meta许可证明确允许。
级别2:闭源API到你自己的模型(违反ToS) — DeepSeek的情况。技术过程相同,但提供商的服务条款禁止将输出用作竞争模型的训练数据。
级别3:专有访问利用(盗窃) — 通过未授权访问获取模型权重。
更好的路径:在开源模型上用你自己的数据微调
- 从开源基础模型开始(Llama 3、Qwen 2.5、Mistral)
- 用基础模型作为教师在你的数据上生成训练示例
- 在这些示例上微调较小模型
- 导出部署——无API调用、零每token成本、零供应商依赖
自有模型胜 过复制模型
在你的领域数据上微调的模型通常在你的特定任务上优于从前沿模型蒸馏的副本。微调给你专家,蒸馏给你压缩的通才。
一家B2B SaaS公司在自己的工单数据上微调达到94%分类准确率。同任务用GPT-4提示工程达到71%。23个百分点的差距。
在Ertas上微调你自己的模型——从数据集到GGUF的完整管道,无需编码。查看方案 →
Ship AI that runs on your users' devices.
Early bird pricing starts at $14.50/mo — locked in for life. Plans for builders and agencies.
Keep reading

Fine-Tuning vs. Distillation: Which One Actually Gives You an AI Moat?
Distillation copies generic capabilities from larger models. Fine-tuning on your own data creates domain-specific capabilities nobody else has. One gives you a cheaper clone — the other gives you a competitive moat.

AI Model IP and Distillation: What the Law Actually Says in 2026
Copyright probably doesn't protect AI model outputs. Anti-distillation ToS clauses are the real enforcement mechanism — but their limits are being tested. Here's the full legal landscape for AI model IP in 2026.

How to Distill Open-Source Models Legally: A Step-by-Step Guide
A practical guide to model distillation the right way: using open-source teacher models with permissive licenses, your own domain data, and a clear legal path to model ownership.