Back to blog
    符合 GDPR 的 AI:如何在不分享用戶資料的情況下使用 LLM
    gdprprivacycompliancelocal-inferencedata-protection

    符合 GDPR 的 AI:如何在不分享用戶資料的情況下使用 LLM

    雲端 LLM API 在 GDPR 下創造了資料處理風險。了解如何使用微調的本地模型建構符合歐洲隱私法規的 AI 功能。

    EEdward Yang··Updated

    要以符合 GDPR 的方式使用 LLM,請在您自己的基礎設施上本地運行微調模型,使用戶資料永遠不會離開您的網路——這消除了對第三方資料處理協議、國際傳輸評估和複雜子處理器管理的需求。根據歐洲數據保護委員會的規定,每個向雲端 LLM 傳輸個人資料的 API 呼叫,都構成 GDPR 第 28 條下的資料處理,觸發一系列合規義務。GDPR 執法力度相當可觀:DLA Piper 的 GDPR 罰款追蹤器報告稱,截至 2025 年初,累計 GDPR 罰款超過 45 億歐元,資料傳輸違規是最大的罰款之一。

    本指南解釋了雲端 AI API 的具體 GDPR 風險、合規實際要求什麼,以及如何使用微調模型的本地推論從根本上解決問題。

    雲端 AI 與 GDPR 的問題

    每個 API 呼叫都是資料處理

    根據 GDPR,將個人資料發送到第三方 API 構成資料處理。當您的應用程式將用戶的文字發送到 LLM 端點時,您已將個人資料(或潛在的個人資料)傳輸給處理器。這觸發了幾個義務:

    • 資料處理協議(DPA) — 您需要與 API 供應商簽訂具有法律約束力的協議,涵蓋他們如何處理資料、保留期限和違規通知程序。
    • 合法依據 — 您需要對此處理有效的法律依據(同意、合法利益或合約必要性)。
    • 資料最小化 — 您必須只發送處理目的所必要的最少資料。
    • 刪除權 — 如果用戶要求刪除,您需要確保 API 供應商也刪除任何保留的資料。
    • 傳輸保障措施 — 如果 API 供應商在歐盟/歐洲經濟區以外處理資料,您需要標準合約條款或其他傳輸機制。

    問題在哪裡變得複雜

    大多數雲端 AI 供應商的服務條款的撰寫方式給了他們對提交資料的廣泛自由。即使他們承諾不使用您的資料進行訓練,資料仍然:

    • 傳輸過他們的網路基礎設施
    • 在他們的伺服器上處理(可能跨司法管轄區)
    • 可能被記錄用於濫用偵測、調試或安全監控
    • 可能受到供應商司法管轄區的政府資料存取請求

    對於處理敏感類別個人資料的應用程式——健康資訊、財務資料、生物特徵資料——風險成倍增加。GDPR 第 9 條對處理特殊類別資料施加了額外限制,大多數雲端 AI DPA 不提供所需的具體保障措施。

    GDPR 合規的實際要求

    對於雲端 AI API

    如果您選擇在個人資料中使用雲端 AI API,您至少需要:

    1. 與 API 供應商簽訂合規的 DPA,指定處理目的、資料類別、保留期限和子處理器列表
    2. 資料保護影響評估(DPIA) — 根據第 35 條,當處理可能對個人造成高風險時需要
    3. 更新的隱私通知 — 告知用戶其資料由 AI 供應商處理
    4. 傳輸影響評估 — 如果資料離開歐盟/歐洲經濟區
    5. 技術措施 — 傳輸中的加密、存取控制、資料最小化
    6. 處理活動記錄 — 在您的第 30 條記錄中記錄 AI 處理

    這是可以實現的,但會產生持續的合規開銷。API 供應商的條款、子處理器列表或資料中心位置的每次變更都需要審查。

    對於本地推論

    當模型在您的基礎設施上運行且資料從不離開您的網路時:

    • 沒有第三方處理器 — AI 推論不需要 DPA(您是控制者和處理者)
    • 沒有國際資料傳輸 — 資料保留在您的基礎設施中
    • 完全控制保留 — 按您的條款刪除資料
    • 簡化的 DPIA — 當資料不離開您的邊界時,風險低
    • 更簡單的隱私通知 — 無需披露第三方 AI 處理

    這不能消除 GDPR 義務——您仍然需要合法的處理依據,必須尊重資料主體的權利,並且必須實施適當的安全措施。但它消除了整個類別的合規複雜性。

    本地推論方法

    架構

    用戶 → 您的應用程式 → 本地模型 → 回應
             (您的基礎設施——資料從不離開)
    

    與雲端方法比較:

    用戶 → 您的應用程式 → 雲端 API → 回應
             (資料跨越組織邊界,可能跨越司法管轄邊界)
    

    如何實作

    1. 在您的領域資料上微調模型 — 模型學習您的任務,無需在推論時擷取個人資料
    2. 匯出為 GGUF — 在標準硬體上運行的可攜式格式
    3. 在您的基礎設施上部署 — 您的伺服器、您的 VPC 或您的本地硬體
    4. 本地提供服務 — 使用 Ollama、llama.cpp 或 vLLM 作為推論引擎

    微調步驟發生一次(或在您改善模型時定期發生)。所有後續推論完全在本地進行。

    訓練資料呢?

    微調本身涉及資料處理。如果您使用個人資料進行訓練,您需要:

    • 使用該資料訓練模型的合法依據
    • 在可能的情況下適當去識別資料
    • 涵蓋訓練過程的 DPIA
    • 訓練資料的適當保留政策

    使用 Ertas,微調在受管理的雲端 GPU 上運行,但訓練資料處理由 DPA 管轄。訓練完成後,模型權重(不包含可恢復的個人資料)以 GGUF 格式匯出以進行本地部署。

    實用合規清單

    建構前

    • 確定您的 AI 功能是否會處理個人資料
    • 識別處理的合法依據
    • 根據風險評估在雲端 API 和本地推論之間做出決定
    • 如果處理是高風險的,完成 DPIA

    對於本地部署

    • 在適當去識別的資料上微調模型
    • 在您的基礎設施邊界內部署模型
    • 在推論端點上實作存取控制
    • 為您自己的稽核目的記錄推論請求
    • 在您的第 30 條記錄中記錄處理
    • 更新隱私通知以反映 AI 輔助處理(無需第三方披露)

    對於雲端 API(如果不可避免)

    • 與 API 供應商簽訂 DPA
    • 驗證子處理器列表和資料中心位置
    • 實作資料最小化——在 API 呼叫前去除不必要的個人資料
    • 如果資料離開歐盟/歐洲經濟區,完成傳輸影響評估
    • 更新隱私通知以披露 AI 處理器
    • 建立跨您的系統和 API 供應商處理資料主體存取/刪除請求的流程

    超越 GDPR

    相同原則適用於其他隱私法規:

    法規主要 AI 關注點本地推論優勢
    GDPR(歐盟)第三方資料處理、國際傳輸消除處理器關係
    英國 GDPR與 GDPR 相同,脫歐後傳輸機制資料保留在司法管轄區內
    CCPA/CPRA(加州)個人資訊的「出售」、服務提供商義務沒有服務提供商資料共享
    HIPAA(美國醫療保健)PHI 向業務夥伴的披露PHI 從不離開涵蓋實體
    PIPEDA(加拿大)披露的同意、問責制沒有跨境披露
    LGPD(巴西)國際資料傳輸、法律依據資料保留在司法管轄區內

    本地推論不僅解決了 GDPR 合規——它通過完全刪除第三方資料流,簡化了幾乎所有隱私法規的合規。

    Ertas 如何幫助

    Ertas 提供訓練基礎設施來創建您隨後在本地部署的微調模型:

    • Studio — 使用視覺介面在受管理的雲端 GPU 上微調模型
    • Vault — 帶有訓練資料稽核追蹤的企業級加密儲存
    • GGUF 匯出 — 下載您的模型以在任何本地基礎設施上部署

    訓練階段使用 Ertas 的雲端。推論階段完全是您的。這種分離意味著您在計算上昂貴的訓練步驟中獲得雲端便利性,同時在最重要的地方——在推論時,當真實用戶資料被處理時——保持完全的資料控制。

    以 $14.50/月的早鳥價格永久鎖定 — 上市時增加到 $34.50/月。加入優先預約 →

    常見問題

    使用 ChatGPT 是否符合 GDPR?

    使用 ChatGPT 或類似的雲端 LLM API 與個人資料並不自動符合 GDPR。每個包含個人資料的 API 呼叫都構成 GDPR 下的資料處理,需要與供應商簽訂資料處理協議、有效的合法依據、高風險處理的資料保護影響評估,以及更新的隱私通知。OpenAI 確實為企業客戶提供 DPA 和資料處理控制,但確保滿足所有要求的合規負擔落在您作為資料控制者身上——包括在歐盟/歐洲經濟區以外處理資料時的國際資料傳輸保障措施。

    我可以在 GDPR 下使用個人資料微調 AI 模型嗎?

    可以,但您需要使用個人資料作為訓練資料的合法依據(如合法利益或同意),必須在可能的情況下去識別資料,並且應該完成涵蓋訓練過程的 DPIA。產生的模型權重不包含可恢復的個人資料,因此微調的模型本身可以在沒有相同處理顧慮的情況下部署。如果您使用雲端服務進行微調,您也需要與該供應商簽訂涵蓋訓練階段的 DPA。

    GDPR 的哪個條款適用於 AI 處理?

    幾個 GDPR 條款與 AI 相關。第 28 條管轄控制者-處理者關係(使用第三方 AI API 時相關)。第 35 條要求對高風險處理進行資料保護影響評估,AI 通常符合資格。第 22 條限制對個人產生重大影響的自動化決策。第 44-49 條管轄國際資料傳輸,當 AI 供應商在歐盟/歐洲經濟區以外處理資料時至關重要。第 9 條為 AI 系統經常處理的特殊類別資料(健康、生物特徵)增加了額外保護。

    AI 違規的 GDPR 罰款如何運作?

    GDPR 罰款最高可達 2,000 萬歐元或全球年營業額的 4%,以較高者為準。根據 DLA Piper 的 GDPR 罰款調查,截至 2025 年初,累計罰款超過 45 億歐元。資料傳輸違規已引發了一些最大的罰款——Meta 在 2023 年因將歐盟用戶資料傳輸到美國而被罰款 12 億歐元。隨著 EU AI Act 下 AI 法規的增加,圍繞 AI 特定資料處理的執法預計將加強。

    延伸閱讀

    Ship AI that runs on your users' devices.

    Early bird pricing starts at $14.50/mo — locked in for life. Plans for builders and agencies.

    Keep reading