What is 模型卡片(Model Card)?

    一种标准化的文档产物,描述机器学习模型的预期用途、性能指标、局限性、伦理考量和训练数据来源。

    Definition

    模型卡片是一种伴随机器学习模型的结构化文档,提供关于模型开发、能力、局限性和适当使用方式的透明信息。由 Mitchell 等人于 2019 年在 Google 提出,模型卡片框架标准化了模型的文档记录方式,类似于营养标签标准化了食品产品信息。模型卡片现已成为广泛采用的最佳实践,并且日益成为监管要求。

    一份完整的模型卡片包含几个标准部分:模型描述(架构、规模、训练方法)、预期用途(模型的设计用途以及明确不适用的场景)、训练数据(来源描述、规模、组成、预处理)、评估结果(不同子群和测试集上的性能指标)、局限性和偏见(已知的失败模式、人口统计偏见、能力边界)、伦理考量(潜在危害、缓解策略、负责任使用指南)以及维护信息(谁维护模型、如何报告问题、更新计划)。

    模型卡片服务于多个受众。对于开发者,它提供正确集成模型所需的技术信息。对于最终用户,它设定了关于模型能做什么和不能做什么的预期。对于监管机构和审计人员,它提供合规评估所需的文档。对于部署模型的组织,它作为风险管理工件,记录模型开发中的尽职调查。

    Why It Matters

    欧盟《人工智能法案》要求对高风险 AI 系统进行文档记录,其要求与模型卡片的内容密切对应——包括训练数据来源、性能指标、已知局限性和预期用途。在欧盟部署 AI 而缺乏充分文档的组织将面临罚款和部署限制。模型卡片是满足这些文档要求的实用机制。

    除了合规之外,模型卡片还能防止误用。一个在英文文本上训练并在美国文化背景下评估的模型,在用于其他语言或文化时可能表现不佳或产生有害输出。如果没有模型卡片记录这些局限性,下游用户无法了解模型的边界。模型卡片使这些局限性变得明确,从而支持知情的部署决策,防止可预见的危害。

    How It Works

    模型卡片的创建通常集成在模型开发工作流中。在训练期间,关于训练过程的元数据(数据源、超参数、训练时长、使用的硬件)通过实验追踪工具自动捕获。训练后,通过在标准和领域特定的基准测试上运行模型来生成评估结果,并按相关子群(语言、人口统计、难度级别)进行分解。

    然后,模型开发者根据对模型能力的理解和评估结果撰写叙述性部分——预期用途、局限性、伦理考量。完成的模型卡片与模型权重一起发布,通常在模型的仓库页面上(例如 Hugging Face Hub)。负责任的团队会在发现有关局限性或偏见的新信息时更新模型卡片,将其视为活文档而非一次性产物。

    Example Use Case

    一家医疗 AI 公司为其临床笔记摘要模型发布了模型卡片。该卡片记录了模型是在美国医院(2015-2024年)的英文临床笔记上训练的,在其测试集上达到了 91% 的 ROUGE-L 分数,但由于术语差异在英国临床笔记上仅达到 73%,尚未在儿科笔记上进行评估,且不应作为临床决策的唯一依据。当一家海外医院考虑部署该模型时,模型卡片帮助他们了解性能差距,并在部署前规划适当的验证。

    Key Takeaways

    • 模型卡片是描述模型能力、局限性和适当用途的标准化文档。
    • 它同时服务于开发者、最终用户、监管机构和组织风险管理。
    • 欧盟《人工智能法案》的文档要求与模型卡片内容密切相关。
    • 关键部分包括预期用途、训练数据、评估结果、局限性和伦理考量。
    • 模型卡片是活文档,应在发现新的局限性或偏见时进行更新。

    How Ertas Helps

    Ertas Studio 可自动生成预填充训练元数据、超参数和评估结果的模型卡片模板。结合 Ertas Data Suite 的数据溯源功能,团队可以以最少的手动工作量生成满足监管要求的全面模型文档。

    Related Resources

    Ship AI that runs on your users' devices.

    Early bird pricing starts at $14.50/mo — locked in for life. Plans for builders and agencies.