金融服务业 AI 治理框架：SR 11-7、模型风险与监管预期

金融服务 AI 治理有着完善的监管基础。SR 11-7——美联储关于模型风险管理的指导——自 2011 年起管辖定量模型验证，并直接适用于在重大金融决策中使用的 AI 系统。OCC 公告 2011-12 对国民银行提出了同等要求。CFPB 的公平借贷指导适用于用于信贷决策的 AI。而 EU AI Act 的高风险分类涵盖了大多数影响消费者权益的金融 AI。

这不是一个新兴的监管领域。金融监管机构有明确的预期。审查员正在询问 AI 治理问题。问题不在于你的 AI 是否需要治理框架——而在于你的框架是否满足监管标准。

SR 11-7：模型风险管理基础

SR 11-7 将模型定义为"应用统计、经济、金融或数学理论、技术和假设来处理输入数据以产生定量估计的定量方法、系统或方法"。在信贷、风险、交易和合规功能中使用的大多数 AI 系统完全属于这一定义范围。

SR 11-7 的三项要求适用于 AI 模型：

模型开发和实施：银行必须了解模型的概念合理性、用于开发模型的数据质量、执行的测试和局限性。对于 AI 模型，这意味着记录训练数据来源、验证方法论、性能指标和已知故障模式——不仅仅是基准测试性能。

模型验证：对模型概念合理性、数据质量和性能的独立审查。关键的是，验证功能必须独立于模型开发和使用功能。SR 11-7 称之为"有效质疑"——在没有组织压力的情况下质疑模型假设、数据选择和性能声明。AI 模型需要与传统定量模型相同的独立性。

治理和控制：对整个组织模型风险的管理层监督。这包括维护模型清单、跟踪模型变更、根据重要性定义风险等级（高/中/低），以及确保模型变更在部署前经过适当审查。

模型清单要求

在重大金融决策中使用的每个 AI 模型都必须在你的模型清单中。"重大"意味着输出影响信贷决策、风险评估、监管资本计算、交易决策或面向客户的建议。

对于每个模型，清单应记录：

模型名称和唯一标识符
所有者（业务线）和开发者（内部或供应商）
模型目的及其支持的决策
基于重要性和复杂性的风险等级（高/中/低）
模型类型（统计、ML、深度学习、LLM）
训练数据描述和日期
最后验证日期和结果
当前状态（活跃 / 审查中 / 退役）
已知局限性和批准的使用条件
第三方供应商关系（如适用，包括供应商的模型文档义务）

监管机构期望模型清单完整、及时且可供审查员访问。清单中的缺口——在生产中未被记录的模型——是重大的审查发现。

金融服务中 AI 特有的治理挑战

SR 11-7 是为统计模型编写的。AI 和机器学习系统带来了 2011 年指导未完全预见到的额外治理挑战，审查员越来越关注这些挑战。

可解释性：传统统计模型（逻辑回归、评分卡模型）产生可解释的输出——你可以将信贷决策追溯到特定的输入变量及其系数。许多 AI 模型，特别是深度学习和大语言模型，原生不产生这种可解释性。对于消费者信贷决策，ECOA 和 Regulation B 要求不利行动通知识别拒绝的具体原因。用于信贷决策的 AI 系统必须产出满足这一标准的解释，这可能需要在基础模型之上使用额外工具（SHAP 值、LIME、基于注意力的解释）。

分布偏移：在历史数据上训练的 AI 模型在市场条件、客户人口统计或经济条件发生变化时可能表现不同。在疫情前数据上训练的信贷模型在疫情期间表现不佳——但这种失败是渐进的，从总体性能指标中并不能立即看出。金融 AI 治理必须包含分布偏移监控：跟踪模型输入的分布是否偏离训练分布，作为性能退化的先行指标。

供应商模型不透明性：许多金融服务 AI 产品基于供应商管理的模型，机构无法完全访问训练数据、模型架构或验证结果。SR 11-7 要求机构对供应商模型进行适当的尽职调查，不能将模型风险管理完全委托给供应商。如果你的 AI 供应商无法提供充分的模型文档，你就无法按 SR 11-7 标准验证模型——你可能无法将其用于重大决策。

模型变更管理：云 AI API 在没有与 SR 11-7 要求相当的正式变更控制流程的情况下更新其模型。当 API 提供商更新你端点背后的模型时，你可能在生产中运行的是与验证过的不同的模型。这是模型风险管理的失败——你在运行未经验证的模型。要求变更通知和测试窗口的合同条款可以解决这个问题，或者完全拥有模型可以彻底消除它。

有效质疑要求

SR 11-7 的有效质疑要求是 AI 部署中最常被违反的治理结构。构建或使用模型的团队不应该是验证它的团队。验证者必须：

在组织上独立于模型开发团队
有权访问模型文档、训练数据和性能记录
有权要求模型变更或撤回批准
有资源进行有意义的独立测试

对于 AI 系统，有效质疑要求验证者能够在独立测试数据上重新运行模型，对训练流水线有足够的了解以识别概念合理性问题，并评估跨人口统计子组的性能以用于公平借贷目的。

实践实施：明确定义验证功能（内部模型风险组、外部验证者或组合）。定义开发团队必须向验证者提供什么文档。按风险等级建立验证时间表（高风险模型：年度；中等：两年一次）。记录验证发现、管理层回应和整改时间表。

公平借贷和算法偏见

用于信贷决策的 AI 受 ECOA（平等信贷机会法）和公平住房法约束，禁止基于受保护特征的信贷歧视。CFPB 和联邦银行监管机构期望金融机构监控 AI 信贷模型的差异影响——当模型产出不成比例地损害受保护群体的结果时，即使没有歧视意图。

AI 模型的公平借贷治理要求：

差异影响测试：在部署前和定期间隔内，测试模型在受保护类别（种族/民族、性别、国籍、年龄）中的输出，以识别不成比例的结果。"差异影响"的阈值遵循公平借贷先例——通常差异影响比率达到 80% 或更高时触发审查。

代理变量分析：AI 模型可以学习使用与受保护特征相关的代理变量（邮政编码、姓名、购物模式）。治理必须包括分析模型是否通过代理有效地使用了禁止的特征。

不利行动解释：确保模型能够产出不利行动通知，识别 Regulation B 要求的信贷拒绝的具体、准确原因。通用解释（"算法因素"）可能不满足监管标准。

子组性能监控：按人口统计子组分别跟踪模型性能（准确率、假阳性率、假阴性率）作为持续监控的一部分。组间性能差异是偏见信号。

金融 AI 的人在回路要求

对于高风险金融决策，人在回路结构既是治理要求也是风险管理实践。

信贷决策：边缘地带的自动信贷决策（临界申请人）应包含人工审查。定义需要人工审查的分数范围或风险等级。极端情况下的自动决策（明确可批准或明确应拒绝）风险较低；边缘群体是 AI 错误最可能发生且后果最严重的地方。

市场风险和交易：AI 辅助交易系统应具有人工监督机制，能够识别和中断异常行为。2010 年闪电崩盘是参考案例——没有有意义人工监督的自动化系统可以迅速放大市场波动。

欺诈和反洗钱：AI 生成的欺诈警报和反洗钱可疑活动报告在提交可疑活动报告（SAR）之前需要人工审查。无论警报是如何生成的，BSA 对有意义审查的要求都适用。

模型输出监控：将审查 AI 模型输出质量的责任分配给特定功能。这与验证不同——这是在正式验证周期之间检测性能退化的持续运营监控。

审计追踪规范

金融服务 AI 审计追踪必须同时满足内部模型风险管理和监管审查要求。重大决策的每次 AI 查询的最少字段：

字段	值
决策 ID	每个申请或交易唯一
时间戳	UTC
模型 ID	清单中的具体模型版本
输入摘要	驱动输出的关键变量（信贷模型的 SHAP 值）
模型输出	评分、建议或分类
决策结果	批准 / 拒绝 / 转交审查
人工审查员	如适用，审查员身份和决策
不利行动代码	用于信贷拒绝

保留期限：ECOA 要求信贷申请记录保留 25 个月；BSA 记录 5 年。AI 决策记录应匹配底层交易保留要求。

供应商模型尽职调查

对于在重大金融决策中使用模型的 AI 供应商，SR 11-7 要求你的机构无法从黑盒供应商那里完全获得的文档。至少要求：

模型开发文档（方法论、训练数据描述、验证历史）
按人口统计子组的性能指标（用于公平借贷相关模型）
第三方验证报告（如有）
数据处理和安全实践（SOC 2、ISO 27001）
变更通知流程和版本控制实践
合同承诺提供模型文档以供审查

如果供应商无法为模型风险管理提供充分的文档，你不能将该模型用于 SR 11-7 监管的决策。这在审查员面前是没有谈判余地的。

模型所有权优势

对于拥有自己微调模型的金融机构，几个 SR 11-7 治理挑战显著简化：

变更管理：模型版本在你的控制之下。你决定何时更新。验证由你的决策触发，而非供应商的 API 更新。
文档完整性：你可以访问训练数据、模型架构和性能指标。验证文档可以完整。
可解释性：你可以用适合你用例的可解释性工具检测模型。
审计追踪：推理在你的基础设施上运行，与你现有的审计日志集成。

拥有模型的治理开销高于使用云 API——但这是正确类型的开销，与 SR 11-7 的要求一致而非冲突。

预约 Ertas 发现通话 →

Ertas Data Suite 为金融服务组织提供完整的审计追踪、操作员级日志和本地推理，数据主权和模型文档是不可妥协的。对于微调流水线，Ertas Studio 处理在你的数据上训练并导出为可部署的 GGUF 格式。

金融服务业 AI 治理框架：SR 11-7、模型风险与监管预期

SR 11-7：模型风险管理基础

模型清单要求

金融服务中 AI 特有的治理挑战

有效质疑要求

公平借贷和算法偏见

金融 AI 的人在回路要求

审计追踪规范

供应商模型尽职调查

模型所有权优势

Ship AI that runs on your users' devices.

Keep reading

建筑与工程行业的 AI 治理框架：安全、责任与专业问责

医疗保健 AI 治理框架：HIPAA、FDA SaMD 与临床监督要求

律所 AI 治理框架：特权、监督与模型问责