EU AI Act(欧盟人工智能法案) & AI Compliance

    满足欧盟人工智能法案的训练数据文档和透明度要求

    Overview

    欧盟人工智能法案是全球首部专门针对人工智能系统制定的综合性监管框架。该法案于2024年3月由欧洲议会通过,将在2027年之前分阶段生效,建立了基于风险的 AI 应用分类体系,并对在欧盟境内运营的 AI 系统的提供者、部署者和进口商施加相应义务。

    该法案将 AI 系统分为四个风险等级:不可接受风险(禁止)、高风险(严格监管)、有限风险(透明度义务)和最小风险(基本不受监管)。高风险 AI 系统——包括用于就业、教育、信用评分、执法和关键基础设施的系统——面临最严格的要求,包括强制性合格评定、质量管理体系和持续的上市后监测。

    对于训练自有模型的 AI 开发者和组织,欧盟人工智能法案在训练数据治理、文档和透明度方面引入了开创性要求。第10条为训练数据的质量、相关性、代表性和偏差测试建立了详细义务。第11条规定必须编制全面的技术文档,描述 AI 系统的预期用途、设计规格、训练方法和验证结果。这些要求从根本上改变了 AI 开发必须被记录和治理的方式。

    AI-Specific Requirements

    欧盟人工智能法案第10条下的训练数据治理要求是对 AI 开发团队影响最大的条款之一。高风险 AI 系统的提供者必须确保训练、验证和测试数据集遵循适当的数据治理和管理实践。这包括检查数据中可能存在的偏差、识别数据差距或缺陷,以及采取措施解决代表性问题。训练数据集必须具有相关性、充分的代表性,并在最大可能范围内无误且完整。

    第13条建立了透明度要求,规定高风险 AI 系统的设计和开发必须确保其运行具有足够的透明度,使部署者能够理解输出并恰当使用系统。这包括清晰记录系统的能力、局限性、已知风险和训练数据特征。对于通用 AI 模型(包括基础模型),第53条增加了进一步的义务,要求提供训练数据文档,包括对训练内容的充分详细摘要。

    该法案还要求建立健全的质量管理体系(第17条),涵盖风险管理程序、数据治理协议、上市后监测计划和事件报告机制。提供者必须在 AI 系统的整个生命周期内维护技术文档,在规定期限内保存系统生成的日志,并与国家市场监督机构合作。违规处罚十分严厉,禁止的 AI 实践可处以最高3500万欧元或全球年营业额7%的罚款,其他违规可处以最高1500万欧元或3%的罚款。

    How Ertas Helps

    Ertas 提供了欧盟人工智能法案所要求的数据治理基础设施。Ertas Data Suite 的数据血缘追踪为训练数据集的每个数据来源、转换和处理步骤创建完整且可审计的记录。这直接满足第10条对数据治理和管理实践的要求,提供了数据如何被收集、筛选、清洗和准备的可验证文档。当监管机构或合格评定机构要求提供数据治理实践的证据时,您拥有完整的溯源链。

    PII 脱敏功能有助于确保训练数据集符合该法案对适当数据保护措施的要求。审计日志系统记录对数据集和模型执行的每项操作,构建第12条为高风险 AI 系统所要求的全面活动日志。Ertas Data Suite 的本地化架构还通过将所有数据处理保留在受控基础设施内来简化法案数据治理要求的合规工作,使组织能够便捷地实施和展示法规所要求的组织和技术措施。

    Ertas Studio 通过提供结构化的模型训练工作流来补充这些能力,该工作流自然生成欧盟人工智能法案所要求的文档产物。训练配置、超参数、数据集版本和评估指标都作为标准工作流的一部分被捕获。Vault 功能确保所有文档、数据集和模型工件均在适当的访问控制下安全存储,支持贯穿 AI 系统整个生命周期的记录保存义务。基于 Ertas 构建,组织建立起系统化的文档实践,使欧盟人工智能法案的合格评定变得更加可控。

    Compliance Checklist

    训练数据血缘和溯源文档Supported
    所有 AI 系统操作的全面审计日志Supported
    数据治理和质量管理基础设施Supported
    偏差检测和数据集代表性分析Partial
    用于合格评定的技术文档生成Partial
    AI 系统的风险分类和管理Customer Responsibility
    上市后监测和事件报告程序Customer Responsibility
    向指定机构提交合格评定Customer Responsibility

    Relevant Ertas Features

    • 数据血缘与溯源追踪
    • 全面审计跟踪
    • 本地化数据治理基础设施
    • PII 脱敏以符合数据保护合规
    • Vault 安全工件存储
    • 带文档记录的结构化训练工作流

    Ship AI that runs on your users' devices.

    Early bird pricing starts at $14.50/mo — locked in for life. Plans for builders and agencies.