
EU-AI-Actcomplianceregulationdata-pipelinechecklistsegment:enterprise
EU AI Act 数据管道合规准备检查器
针对 AI 训练数据管道应用 EU AI Act 第 10 条和第 30 条的合规准备框架。包含高风险和有限风险系统的检查表,重点关注 2026 年 8 月的截止日期。
EErtas Team·
EU AI Act 对高风险 AI 系统的要求将于 2026 年 8 月生效——距本文发布日期还有五个月。如果您的组织开发、部署或提供根据该法规分类为高风险的 AI 系统,您的数据管道必须满足数据治理、文档和可追溯性方面的特定要求。
本准备检查器专门针对 EU AI Act 第 10 条和第 30 条中的数据管道要求。它不涵盖该法规的全部范围(包括风险评估、人工监督、稳健性等),但数据治理是大多数组织差 距最大、工作量最多的领域。
使用本检查器评估您当前的准备情况,识别差距,并在 2026 年 8 月执行日期之前确定补救措施的优先级。
了解您的风险分类
在评估合规准备之前,您需要确定您的 AI 系统属于高风险还是有限风险分类。EU AI Act 在附件 III 中定义了高风险系统,涵盖以下领域:
- 生物特征识别和分类
- 关键基础设施的管理和运营
- 教育和职业培训(准入、评估)
- 就业、工人管理和自主就业(招聘、评估)
- 基本公共和私人服务的获取(信用评分、保险)
- 执法、移民和边境管控
- 司法管理和民主进程
如果您的 AI 系统在这些领域中的任何一个运行,它几乎肯定被分类为高风险,并受第 10 条和第 30 条的全部要求约束。
不在高风险类别中的系统可能仍受有限风险要求(主要是透明度义务)或通用 AI 模型要求的约束(如果涉及基础模型)。
第 10 条:数据和数据治理要求
第 10 条为高风险 AI 系统中使用的训练、验证和测试数据集建立了要求。以下检查表涵盖了每项要求以及您的数据管道的具体标准。
高风险系统检查表——第 10 条
| 要求 | 您的管道必须做什么 | 就绪 | 部分就绪 | 未就绪 |
|---|---|---|---|---|
| 10(2) 数据治理 | 实施文档化的数据治理框架,涵盖设计选择、数据收集、准备操作、假设制定以及数据可用性、数量和适用性评估 | 管道具有文档化的数据治理政策,涵盖端到端数 据处理 | 存在一些文档但覆盖范围有差距 | 没有正式的数据治理框架 |
| 10(2)(a) 设计选择 | 记录数据收集和处理的设计选择,包括选择的数据源及原因 | 数据源选择和处理逻辑已文档化并进行版本控制 | 团队理解设计选择但未正式记录 | 设计选择是临时性的且未记录 |
| 10(2)(b) 数据收集 | 记录数据收集流程,包括数据的来源、目的和数量 | 管道记录数据来源:每个数据集的源、时间戳、数量和收集方法 | 部分来源追踪;一些源未记录 | 没有系统化的来源追踪 |
| 10(2)(c) 数据准备 | 记录所有数据准备操作,包括标注、标签、清洗、丰富和聚合 | 每个管道转换都记录了操作者 ID、时间戳和输入/输出描述 | 主要转换已记录但阶段之间存在差距 | 转换未被记录 |
| 10(2)(d) 假设 | 记录关于数据衡量和代表内容的假设 | 关于数据代表性和衡量的假设已记录 | 一些假设非正式记录 | 没有记录的假设 |
| 10(2)(e) 可用性评估 | 评估和记录数据的可用性、数量和适用性 | 关于训练数据是否充分和具有代表性的文档化评估 | 已进行评估但未正式记录 | 未进行评估 |
| 10(2)(f) 偏见检查 | 检查数据中可能影响健康、安全或基本权利的偏见 | 已进行并记录系统性偏见分析,并记录了缓解步骤 | 进行了一些偏见分析但不全面 | 没有偏见检查流程 |
| 10(2)(g) 数据差距 | 识别和解决可能影响合规性的数据差距 | 差距分析已记录并有补救计划 | 非正式地识别了差距但没 有系统化流程 | 没有差距识别流程 |
| 10(3) 代表性 | 训练、验证和测试数据集必须相关、具有充分代表性且尽可能没有错误 | 数据集代表性的统计分析已记录;数据质量指标被追踪 | 对代表性的非正式评估 | 没有代表性分析 |
| 10(4) 数据属性考量 | 考虑 AI 系统的特定地理、上下文、行为或功能设置 | 数据集组成反映部署上下文;上下文因素的文档化分析 | 对上下文有一些考虑但不系统化 | 不考虑部署上下文 |
| 10(5) 个人数据处理 | 个人数据处理必须遵循 GDPR;特殊类别数据仅在偏见检测和纠正严格必要时才可处理 | PII/PHI 检测和编辑内置于管道中;特殊类别数据处理已记录 | 有一些 PII 处理但覆盖范围或文档存在差距 | 管道中没有系统化的 PII 处理 |