
符合 GDPR 的 AI:如何在不分享用戶資料的情況下使用 LLM
雲端 LLM API 在 GDPR 下創造了資料處理風險。了解如何使用微調的本地模型建構符合歐洲隱私法規的 AI 功能。
要以符合 GDPR 的方式使用 LLM,請在您自己的基礎設施上本地運行微調模型,使用戶資料永遠不會離開您的網路——這消除了對第三方資料處理協議、國際傳輸評估和複雜子處理器管理的需求。根據歐洲數據保護委員會的規定,每個向雲端 LLM 傳輸個人資料的 API 呼叫,都構成 GDPR 第 28 條下的資料處理,觸發一系列合規義務。GDPR 執法 力度相當可觀:DLA Piper 的 GDPR 罰款追蹤器報告稱,截至 2025 年初,累計 GDPR 罰款超過 45 億歐元,資料傳輸違規是最大的罰款之一。
本指南解釋了雲端 AI API 的具體 GDPR 風險、合規實際要求什麼,以及如何使用微調模型的本地推論從根本上解決問題。
雲端 AI 與 GDPR 的問題
每個 API 呼叫都是資料處理
根據 GDPR,將個人資料發送到第三方 API 構成資料處理。當您的應用程式將用戶的文字發送到 LLM 端點時,您已將個人資料(或潛在的個人資料)傳輸給處理器。這觸發了幾個義務:
- 資料處理協議(DPA) — 您需要與 API 供應商簽訂具有法律約束力的協議,涵蓋他們如何處理資料、保留期限和違規通知程序。
- 合法依據 — 您需要對此處理有效的法律依據(同意、合法利益或合約必要性)。
- 資料最小化 — 您必須只發送處理目的所必要的最少資料。
- 刪除權 — 如果用戶要求刪除,您需要確保 API 供應商也刪除任何保留的資料。
- 傳輸保障措施 — 如果 API 供應商在歐盟/歐洲經濟區以外處理資料,您需要標準合約條款或其他傳輸機制。
問題在哪裡變得複雜
大多數雲端 AI 供應商的服務條款的撰寫方式給了他們對提交資料的廣泛自由。即使他們承諾不使用您的資料進行訓練,資料仍然:
- 傳輸過他們的網路基礎設施
- 在他們的伺服器上處理(可能跨司法管轄區)
- 可能被記錄用於濫用偵測、調試或安全監控
- 可能受到供應商司法管轄區的政府資料存取請求
對於處理敏感類別個人資料的應用程式——健康資訊、財務資料、生物特徵資料——風險成倍增加。GDPR 第 9 條對處理特殊類別資料施加了額外限制,大多數雲端 AI DPA 不提供所需的具體保障措施。
GDPR 合規的實際要求
對於雲端 AI API
如果您選擇在個人資料中使用雲端 AI API,您至少需要:
- 與 API 供應商簽訂合規的 DPA,指定處理目的、資料類別、保留期限和子處理器列表
- 資料保護影響評估(DPIA) — 根據第 35 條,當處理可能對個人造成高風險時需要
- 更新的隱私通知 — 告知用戶其資料由 AI 供應商處理
- 傳輸影響評估 — 如果資料離開歐盟/歐洲經濟區
- 技術措施 — 傳輸中的加密、存取控制、資料最小化
- 處理活動記錄 — 在您的第 30 條記錄中記錄 AI 處理
這是可以實現的,但會產生持續的合規開銷。API 供應商的條款、子處理器列表或資料中心位置的每次變更都需要審查。
對於本地推論
當模型在您的基礎設施上運行且資料從不離開您的網路時:
- 沒有第三方處理器 — AI 推論不需要 DPA(您是控制者和處理者)
- 沒有國際資料傳輸 — 資料保留在您的基礎設施中
- 完全控制保留 — 按您的條款刪除資料
- 簡化的 DPIA — 當資料不離開您的邊界時,風險低
- 更簡單的隱私通知 — 無需披露第三方 AI 處理
這不能消除 GDPR 義務——您仍然需要合法的處理依據,必須尊重資料主體的權利,並且必須實施適當的安全措施。但它消除了整個類別的合規複雜性。
本地推論方法
架構
用戶 → 您的應用程式 → 本地模型 → 回應
(您的基礎設施——資料從不離開)
與雲端方法比較:
用戶 → 您的應用程式 → 雲端 API → 回應
(資料跨越組織邊界,可能跨越司法管轄邊界)
如何實作
- 在您的領域資料上微調模型 — 模型學習您的任務,無需在推論時擷取個人資料
- 匯出為 GGUF — 在標準硬體上運行的可攜式格式
- 在您的基礎設施上部署 — 您的伺服器、您的 VPC 或您的本地硬體
- 本地提供服務 — 使用 Ollama、llama.cpp 或 vLLM 作為推論引擎
微調步驟發生一次(或在您改善模型時定期發生)。所有後續推論完全在本地進行。
訓練資料呢?
微調本身涉及資料處理。如果您使用個人資料進行訓練,您需要:
- 使用該資料訓練模型的合法依據
- 在可能的情況下適當去識別資料
- 涵蓋訓練過程的 DPIA
- 訓練資料的適當保留政策
使用 Ertas,微調在受管理的雲端 GPU 上運行,但訓練資料處理由 DPA 管轄。訓練完成後,模型權重(不包含可恢復的個人資料)以 GGUF 格式匯出以進行本地部署。
實用合規清單
建構前
- 確定您的 AI 功能是否會處理個人資料
- 識別處理的合法依據
- 根據風險評估在雲端 API 和本地推論之間做出決定
- 如果處理是高風險的,完成 DPIA
對於本地部署
- 在適當去識別的資料上微調模型
- 在您的基礎設施邊界內部署模型
- 在推論端點上實作存取控制
- 為您自己的稽核目的記錄推論請求
- 在您的第 30 條記錄中記錄處理
- 更新隱私通知以反映 AI 輔助處理(無需第三方披露)
對於雲端 API(如果不可避免)
- 與 API 供應商簽訂 DPA
- 驗證子處理器列表和資料中心位置
- 實作資料最小化——在 API 呼叫前去除不必要的個人資料
- 如果資料離開歐盟/歐洲經濟區,完成傳輸影響評估
- 更新隱私通知以披露 AI 處理器
- 建立跨您的系統和 API 供應商處理資料主體存取/刪除請求的流程
超越 GDPR
相同原則適用於其他隱私法規:
| 法規 | 主要 AI 關注點 | 本地推論優勢 |
|---|---|---|
| GDPR(歐盟) | 第三方資料處理、國際傳輸 | 消除處理器關係 |
| 英國 GDPR | 與 GDPR 相同,脫歐後傳輸機制 | 資料保留在司法管轄區內 |
| CCPA/CPRA(加州) | 個人資訊的「出售」、服務提供商義務 | 沒有服務提供商資料共享 |
| HIPAA(美國醫療保健) | PHI 向業務夥伴的披露 | PHI 從不離開涵蓋實體 |
| PIPEDA(加拿大) | 披露的同意、問責制 | 沒有跨境披露 |
| LGPD(巴西) | 國際資料傳輸、法律依據 | 資料保留在司法管轄區內 |
本地推論不僅解決了 GDPR 合規——它通過完全刪除第三方資料流,簡化了幾乎所有隱私法規的合規。
Ertas 如何幫助
Ertas 提供訓練基礎設施來創建您隨後在本地部署的微調模型:
- Studio — 使用視覺介面在受管理的雲端 GPU 上微調模型
- Vault — 帶有訓練資料稽核追蹤的企業級加密儲存
- GGUF 匯出 — 下載您的模型以在任何本地基礎設施上部署
訓練階段使用 Ertas 的雲端。推論階段完全是您的。這種分離意味著您在計算上昂貴的訓練步驟中獲得雲端便利性,同時在最重要的地方——在推論時,當真實用戶資料被處理時——保持完全的資料控制。
以 $14.50/月的早鳥價格永久鎖定 — 上市時增加到 $34.50/月。加入優先預約 →
常見問題
使用 ChatGPT 是否符合 GDPR?
使用 ChatGPT 或類似的雲端 LLM API 與個人資料並不自動符合 GDPR。每個包含個人資料的 API 呼叫都構成 GDPR 下的資料處理,需要與供應商簽訂資料處理協議、有效的合法依據、高風險處理的資料保護影響評估,以及更新的隱私通知。OpenAI 確實為企業客戶提供 DPA 和資料處理控制,但確保滿足所有要求的合規負擔落在您作為資料控制者身上——包括在歐盟/歐洲經濟區以外處理資料時的國際資料傳輸保障措施。
我可以在 GDPR 下使用個人資料微調 AI 模型嗎?
可以,但您需要使用個人資料作為訓練資料的合法依據(如合法利益或同意),必須在可能的情況下去識別資料,並且應該完成涵蓋訓練過程的 DPIA。產生的模型權重不包含可恢復的個人資料,因此微調的模型本身可以在沒有相同處理顧慮的情況下部署。如果您使用雲端服務進行微調,您也需要與該供應商簽訂涵蓋訓練階段的 DPA。
GDPR 的哪個條款適用於 AI 處理?
幾個 GDPR 條款與 AI 相 關。第 28 條管轄控制者-處理者關係(使用第三方 AI API 時相關)。第 35 條要求對高風險處理進行資料保護影響評估,AI 通常符合資格。第 22 條限制對個人產生重大影響的自動化決策。第 44-49 條管轄國際資料傳輸,當 AI 供應商在歐盟/歐洲經濟區以外處理資料時至關重要。第 9 條為 AI 系統經常處理的特殊類別資料(健康、生物特徵)增加了額外保護。
AI 違規的 GDPR 罰款如何運作?
GDPR 罰款最高可達 2,000 萬歐元或全球年營業額的 4%,以較高者為準。根據 DLA Piper 的 GDPR 罰款調查,截至 2025 年初,累計罰款超過 45 億歐元。資料傳輸違規已引發了一些最大的罰款——Meta 在 2023 年因將歐盟用戶資料傳輸到美國而被罰款 12 億歐元。隨著 EU AI Act 下 AI 法規的增加,圍繞 AI 特定資料處理的執法預計將加強。
延伸閱讀
- 注重隱私的 AI 開發 — 隱私優先 AI 的更廣泛論據
- 本地運行 AI 模型 — 硬體、工具和部署選項
- 按 token 計費 AI 定價的隱藏成本 — 本地推論的經濟論據
Ship AI that runs on your users' devices.
Early bird pricing starts at $14.50/mo — locked in for life. Plans for builders and agencies.
Keep reading

GDPR + EU AI Act: Double Compliance for AI Training Data
How enterprises must navigate both GDPR and EU AI Act requirements simultaneously when preparing AI training data — covering data minimization, consent, and the tension between privacy and AI needs.

Fine-Tuning and Safety Alignment: What You Need to Know Before Deploying
Understanding how fine-tuning affects model safety — why alignment can degrade during training, how to maintain safety guardrails, and practical testing strategies for production deployments.

HIPAA, GDPR, and OpenClaw: A Compliance Guide for Regulated Industries
OpenClaw in healthcare, legal, or finance is a compliance minefield when using cloud APIs. Here's how to map the data flows, identify risks, and deploy compliantly with local models.