
GDPR 合规 AI:如何在不共享用户数据的情况下使用 LLM
云 LLM API 在 GDPR 下造成数据处理风险。了解如何使用 fine-tuned 本地模型构建符合欧洲隐私法规的 AI 功能。
要以 GDPR 合规的方式使用 LLM,在你自己的基础设施上运行 fine-tuned 模型,使用户数据永远不离开你的网络——这消除了对第三方数据处理协议、国际传输评估和复杂子处理商管理的需求。根据欧洲数据保护委员会,每个将个人数据传输到云 LLM 的 API 调用都构成 GDPR 第 28 条下的数据处理,触发一系列合规义务。
云 AI 与 GDPR 的问题
每个 API 调用都是数据处理
在 GDPR 下,向第三方 API 发送个人数据构成数据处理。这触发了多项义务:数据处理协议 (DPA)、合法依据、数据最小化、删除权和传输保障。
复杂之处
大多数云 AI 提供商的服务条款给了他们对提交数据的广泛处理空间。即使承诺不用于训练,数据仍然经过其网络、在其服务器上处理、可能被记录。
本地推理方法
架构
用户 → 你的应用 → 本地模型 → 响应
(你的基础设施 — 数据永远不离开)
实施步骤
- 在你的领域数据上 fine-tune 模型
- 导出为 GGUF
- 部署在你的基础设施上
- 本地服务 — 使用 Ollama、llama.cpp 或 vLLM
本地推理不能消除 GDPR 义务——你仍然需要合法依据。但它移除了整类合规复杂性。
实用合规清单
本地部署
- 在适当脱敏的数据上 fine-tune 模型
- 在基础设施边界内部署模型
- 实施推理端点的访问控制
- 记录推理请求用于审计
- 在第 30 条记录中记录处理
- 更新隐私通知
超越 GDPR
| 法规 | 关键 AI 关注点 | 本地推理优势 |
|---|---|---|
| GDPR(欧盟) | 第三方数据处理 | 消除处理者关系 |
| HIPAA(美国医疗) | PHI 披露 | PHI 永不离开受保实体 |
| CCPA/CPRA(加州) | 个人信息"出售" | 无服务提供者数据共享 |
常见问题
使用 ChatGPT 符合 GDPR 合规吗?
使用 ChatGPT 或类似云 LLM API 处理个人数据并不自动符合 GDPR 合规。每个包含个人数据的 API 调用都构成 GDPR 下的数据处理,需要与提供商的数据处理协议、有效的合法依据等。
可以在 GDPR 下使用个人数据 fine-tune AI 模型吗?
可以,但你需要合法依据,必须尽可能脱敏数据,并应完成涵盖训练过程的 DPIA。产生的模型权重不包含可恢复的个人数据。
延伸阅读
Ship AI that runs on your users' devices.
Early bird pricing starts at $14.50/mo — locked in for life. Plans for builders and agencies.
Keep reading

Best RAG Pipeline With Built-In PII Redaction: Why Retrieval Without Redaction Is a Compliance Risk
Most RAG pipelines index raw documents with PII still intact. Once sensitive data is embedded in a vector store, it is retrievable by any query. Learn how to build a GDPR-safe RAG pipeline with PII redaction before embedding.

GDPR-Compliant RAG Pipeline: Right to Erasure, Data Minimisation, and Vector Store Implications
GDPR Article 17 gives individuals the right to have their data deleted — but once personal data is embedded in a vector store, deletion is not straightforward. Here is how to build a RAG pipeline that handles GDPR from the start.

Building a GDPR-Safe RAG Pipeline: Redaction, Consent, and the Right to Be Forgotten in Vector Databases
Vector databases were not designed for GDPR. They have no concept of consent tracking, purpose limitation, or selective deletion. Here is how to build a RAG pipeline that handles data subject rights from day one.