What is PII Redaction(PII 遮蔽)?
在使用資料進行模型訓練前,檢測並移除或遮罩個人可識別資訊的過程。
Definition
PII(個人可識別資訊)遮蔽是在文字用於模型訓練、評估或儲存之前,自動或半自動識別並移除或替換個人資料元素的過程。PII 包括姓名、電子郵件地址、電話號碼、社會安全號碼、醫療記錄號碼、金融帳戶號碼、實體地址、出生日期,以及任何可用於識別特定個人的其他資訊。
遮蔽可以採取多種形式。移除是將 PII 替換為通用佔位符(例如 '[NAME]' 或 '[EMAIL]'