Back to blog
    EU AI Act 第10条:对你的 AI 训练数据意味着什么
    eu-ai-actcompliancedata-governanceenterprise-aisegment:enterprise

    EU AI Act 第10条:对你的 AI 训练数据意味着什么

    EU AI Act 第10条对高风险 AI 系统设定了严格的数据治理要求。以下是它对准备 AI 训练数据的企业团队意味着什么——以及2026年8月合规截止日期。

    EErtas Team·

    当 EU AI Act 于2024年8月生效时,大多数评论聚焦于禁止 AI 实践(第5条)和高风险系统要求(附件III)。较少关注第10条——管理用于构建高风险 AI 系统的数据的条款。这是一个问题,因为第10条对你的训练数据、验证数据和测试数据施加了具体的、可执行的要求——大多数企业 AI 团队目前未能满足的要求。

    高风险 AI 系统的完全适用截止日期是2026年8月2日

    第10条实际要求什么

    第1段:数据管理实践

    提供者必须实施涵盖数据设计选择、数据收集过程、相关数据准备操作、数据如何与 AI 系统预期目的对齐的数据治理和管理实践。

    第2段:数据质量标准

    训练、验证和测试数据集必须是相关的、具有代表性的、尽可能无错误的和完整的

    第3段:偏差检查

    必须检查数据集是否存在可能影响 AI 系统输出并导致健康、安全或基本权利风险的偏差。

    第4段:敏感数据

    允许在严格条件下收集和处理敏感个人数据类别用于偏差检测。

    第5段:与运营环境的相关性

    代表性要求延伸到 AI 实际运营的特定地理、行为和功能环境。

    审计追踪要求

    将第10条和第11条放在一起阅读,高风险 AI 系统提供者必须能够重建其训练数据的历史:包含了什么、排除了什么、应用了什么转换,以及为什么。

    大多数当前的数据准备管道——由 Docling、Label Studio、Cleanlab 和临时脚本拼凑而成——不会产生共享的血缘。

    Ertas Data Suite 如何支持第10条合规

    Ertas Data Suite 将第10条合规作为一等要求设计。五个管道阶段——摄入、清理、标注、增强、导出——的每个转换都记录时间戳和操作员 ID。管道完全在本地运行,无数据外流。


    Your data is the bottleneck — not your models.

    Ertas Data Suite turns unstructured enterprise files into AI-ready datasets — on-premise, air-gapped, with full audit trail. One platform replaces 3–7 tools.

    Turn unstructured data into AI-ready datasets — without it leaving the building.

    On-premise data preparation with full audit trail. No data egress. No fragmented toolchains. EU AI Act Article 30 compliance built in.

    Keep reading