Anthropic/DeepSeek 事件展示了蒸馏出错时会发生什么：24,000 个账户被封禁。但技术本身是合理的——问题在于来源，而非方法。

合法 vs. 非法蒸馏

合法蒸馏： 使用许可宽松的开源模型作为教师。许可证授予你创建衍生作品的权利。

非法蒸馏（或违反 ToS）： 违反服务条款使用闭源 API 模型作为教师。

第 1 步：选择开源教师模型

本地部署、云 GPU 租赁或开源 API 提供商。

使用教师处理你的领域特定内容。目标数据集：500-5,000 个示例。

JSONL 格式。质量过滤：去重、移除矛盾、验证格式一致性。

教师 70B → 学生 7B-14B 是生产部署的最佳选择。LoRA/QLoRA 使之实用。

目标：分类和提取任务 90-95% 准确率，生成任务在教师质量的 5-10% 以内。

ollama create my-model -f Modelfile
ollama run my-model

你的模型现在在本地运行。没有 API 调用。没有每 token 成本。没有能弃用它的供应商。

正确的方法：开源教师 + 你的领域数据 + 合法微调 + GGUF 导出 + 完全所有权。