
eu-ai-actdata-governancechecklisthigh-risk-aicompliancesegment:enterprise
高风险 AI 系统的 EU AI Act 数据治理清单
涵盖 EU AI Act 下高风险 AI 系统数据质量、偏差检测、文档、审计追踪和监控义务的可操作清单。
EErtas Team·
如果你正在构建或部署 EU AI Act 下的高风险 AI 系统,第10条要求对你的 训练、验证和测试数据集实施特定的数据治理实践。本清单直接映射到法规要求。
1. 数据收集和来源
记录所有训练数据的来源、收集方法、法律基础。
2. 数据准备和清理
记录所有准备操作、使用的工具和版本、去重方法、PII/PHI 检测和脱敏方法。
3. 标注和打标
定义标注模式、记录标注者资质、测量标注者间一致性率。
4. 偏差检查
定义检查维度、运行偏差分析、记录发现和缓解措施。
5. 数据质量评估
定义质量标准、测量错误率、评估代表性。
6. 统计属性
记录数据集大小、类别分布、关键特征统计属性。
7. 数据血缘和可追溯性
实施记录级血缘追踪、记录每个转换的时间戳、归属每个操作到已识别的操作员。
8. 数据集版本控制
实施唯一版本标识符、记录哪个数据集版本训练了哪个模型版本。