What is 模型卡片（Model Card）?

一种标准化的文档产物，描述机器学习模型的预期用途、性能指标、局限性、伦理考量和训练数据来源。

Definition

模型卡片是一种伴随机器学习模型的结构化文档，提供关于模型开发、能力、局限性和适当使用方式的透明信息。由 Mitchell 等人于 2019 年在 Google 提出，模型卡片框架标准化了模型的文档记录方式，类似于营养标签标准化了食品产品信息。模型卡片现已成为广泛采用的最佳实践，并且日益成为监管要求。

一份完整的模型卡片包含几个标准部分：模型描述（架构、规模、训练方法）、预期用途（模型的设计用途以及明确不适用的场景）、训练数据（来源描述、规模、组成、预处理）、评估结果（不同子群和测试集上的性能指标）、局限性和偏见（已知的失败模式、人口统计偏见、能力边界）、伦理考量（潜在危害、缓解策略、负责任使用指南）以及维护信息（谁维护模型、如何报告问题、更新计划）。

模型卡片服务于多个受众。对于开发者，它提供正确集成模型所需的技术信息。对于最终用户，它设定了关于模型能做什么和不能做什么的预期。对于监管机构和审计人员，它提供合规评估所需的文档。对于部署模型的组织，它作为风险管理工件，记录模型开发中的尽职调查。

Why It Matters

欧盟《人工智能法案》要求对高风险 AI 系统进行文档记录，其要求与模型卡片的内容密切对应——包括训练数据来源、性能指标、已知局限性和预期用途。在欧盟部署 AI 而缺乏充分文档的组织将面临罚款和部署限制。模型卡片是满足这些文档要求的实用机制。

除了合规之外，模型卡片还能防止误用。一个在英文文本上训练并在美国文化背景下评估的模型，在用于其他语言或文化时可能表现不佳或产生有害输出。如果没有模型卡片记录这些局限性，下游用户无法了解模型的边界。模型卡片使这些局限性变得明确，从而支持知情的部署决策，防止可预见的危害。

How It Works

模型卡片的创建通常集成在模型开发工作流中。在训练期间，关于训练过程的元数据（数据源、超参数、训练时长、使用的硬件）通过实验追踪工具自动捕获。训练后，通过在标准和领域特定的基准测试上运行模型来生成评估结果，并按相关子群（语言、人口统计、难度级别）进行分解。

然后，模型开发者根据对模型能力的理解和评估结果撰写叙述性部分——预期用途、局限性、伦理考量。完成的模型卡片与模型权重一起发布，通常在模型的仓库页面上（例如 Hugging Face Hub）。负责任的团队会在发现有关局限性或偏见的新信息时更新模型卡片，将其视为活文档而非一次性产物。

Example Use Case

一家医疗 AI 公司为其临床笔记摘要模型发布了模型卡片。该卡片记录了模型是在美国医院（2015-2024年）的英文临床笔记上训练的，在其测试集上达到了 91% 的 ROUGE-L 分数，但由于术语差异在英国临床笔记上仅达到 73%，尚未在儿科笔记上进行评估，且不应作为临床决策的唯一依据。当一家海外医院考虑部署该模型时，模型卡片帮助他们了解性能差距，并在部署前规划适当的验证。