
pii-redactionphi-redactionon-premisehipaagdprdata-preparationsegment:service-provider
跨行業服務提供商的本地端個人識別資訊和受保護健康資訊編輯工作流程
構建本地端個人識別資訊/受保護健康資訊編輯管道的技術指南,無需雲端依賴即可處理醫療、法律、金融和政府資料。
EErtas Team·
在訓練資料可以使用之前,必須移除敏感資訊。這不是最佳實踐——這是 HIPAA、GDPR 和大多數資料處理協議下的法律要求。對於跨多個行業工作的服務提供商,挑戰在於「敏感」的定義因行業而異,可接受的編輯方法因法規而異。
醫療客戶需要根據 HIPAA 安全港編輯受保護健康資訊。法律客戶需要保護律師-客戶特許資訊。金融客戶需要移除帳號和 SSN。政府客戶需要剝離機密指標。而且他們都期望編輯在本地端進行,因為將他們的資料發送到雲端 API 進行實體偵測正是他們雇用您來防止的那種資料曝露。
本指南涵蓋構建本地端個人識別資訊/受保護健康資訊編輯工作流程的技術方法,這些工作流程在沒有雲端依賴的情況下處理多行業要求。
個人識別資訊 vs. 受保護健康資訊:每個行業要求您編輯什麼
個人識別資訊(PII)
個人識別資訊是任何可以識別特定個人的資訊。在 GDPR 下,定義很廣泛——任何「涉及已識別或可識別自然人的」資料。在美國法規下,定義因背景而異,但通常包括:
- 全名
- 社會安全號碼
- 駕駛執照號碼
- 電子郵 件地址
- 電話號碼
- 實際地址
- 出生日期
- 生物識別標識符
- 金融帳號
受保護健康資訊(PHI)
受保護健康資訊是 HIPAA 特定的類別,包括個人識別資訊加上健康相關資料。HIPAA 的安全港方法規定了 18 種必須移除才能認為資料已去識別化的識別符類型:
| # | 識別符 | 示例 |
|---|---|---|
| 1 | 姓名 | 患者全名 |
| 2 | 地理資料 | 地址、郵遞區號(人口少於 20,000 的前 3 位數字) |
| 3 | 日期 | 除年份以外的所有日期(超過 89 歲的患者,連年份也需要) |
| 4 | 電話號碼 | 所有電話號碼 |
| 5 | 傳真號碼 | 所有傳真號碼 |
| 6 | 電子郵件地址 | 所有電子郵件地址 |
| 7 | SSN | 社會安全號碼 |
| 8 | MRN | 病歷號碼 |
| 9 | 健康計劃號碼 | 保險受益人號碼 |
| 10 | 帳號 | 金融帳號 |
| 11 | 證書/ 執照號碼 | 職業執照 |
| 12 | 車輛識別符 | 車牌、VIN |
| 13 | 設備識別符 | 序列號、UDI |
| 14 | URL | 網址 |
| 15 | IP 地址 | 網路地址 |
| 16 | 生物識別標識符 | 指紋、聲紋 |
| 17 | 照片 | 全臉照片 |
| 18 | 任何其他唯一識別符 | 唯一 ID 的統稱 |