
金融服务业 AI 治理框架:SR 11-7、模型风险与监管预期
金融服务 AI 治理受 SR 11-7、OCC 指导以及日益增长的 EU AI Act 约束。以下是如何构建满足审查员预期的模型风险管理框架。
金融服务 AI 治理有着完善的监管基础。SR 11-7——美联储关于模型风险管理的指导——自 2011 年起管辖定量模型验证,并直接适用于在重大金融决策中使用的 AI 系统。OCC 公告 2011-12 对国民银行提出了同等要求。CFPB 的公平借贷指导适用于用于信贷决策的 AI。而 EU AI Act 的高风险分类涵盖了大多数影响消费者权益的金融 AI。
这不是一个新兴的监管领域。 金融监管机构有明确的预期。审查员正在询问 AI 治理问题。问题不在于你的 AI 是否需要治理框架——而在于你的框架是否满足监管标准。
SR 11-7:模型风险管理基础
SR 11-7 将模型定义为"应用统计、经济、金融或数学理论、技术和假设来处理输入数据以产生定量估计的定量方法、系统或方法"。在信贷、风险、交易和合规功能中使用的大多数 AI 系统完全属于这一定义范围。
SR 11-7 的三项要求适用于 AI 模型:
模型开发和实施:银行必须了解模型的概念合理性、用于开发模型的数据质量、执行的测试和局限性。对于 AI 模型,这意味着记录训练数据来源、验证方法论、性能指标和已知故障模式——不仅仅是基准测试性能。
模型验证:对模型概念合理性、数据质量和性能的独立审查。关键的是,验证功能必须独立于模型开发和使用功能。SR 11-7 称之为"有效质疑"——在没有组织压力的情况下质疑模型假设、数据选择和性能声明。AI 模型需要与传统定量模型相同的独立性。
治理和控制:对整个组织模型风险的管理层监督。这包括 维护模型清单、跟踪模型变更、根据重要性定义风险等级(高/中/低),以及确保模型变更在部署前经过适当审查。
模型清单要求
在重大金融决策中使用的每个 AI 模型都必须在你的模型清单中。"重大"意味着输出影响信贷决策、风险评估、监管资本计算、交易决策或面向客户的建议。
对于每个模型,清单应记录:
- 模型名称和唯一标识符
- 所有者(业务线)和开发者(内部或供应商)
- 模型目的及其支持的决策
- 基于重要性和复杂性的风险等级(高/中/低)
- 模型类型(统计、ML、深度学习、LLM)
- 训练数据描述和日期
- 最后验证日期和结果
- 当前状态(活跃 / 审查中 / 退役)
- 已知局限性和批准的使用条件
- 第三方供应商关系(如适用,包括供应商的模型文档义务)
监管机构期望模型清单完整、及时且可供审查员访问。清单中的缺口——在生产中未被记录的模型——是重大的审查发现。
金融服务中 AI 特有的治理挑战
SR 11-7 是为统计模型编写的。AI 和机器学习系统带来了 2011 年指导未完全预见到的额外治理挑战,审查员越来越关注这些挑战。
可解释性:传统统计模型(逻辑回归、评分卡模型)产生可解释的输出——你可以将信贷决策追溯到特定的输入变量及其系数。许多 AI 模型,特别是深度学习和大语言模型,原生不产生这种可解释性。对于消费者信贷决策,ECOA 和 Regulation B 要求不利行动通知识别拒绝的具体原因。用于信贷决策的 AI 系统必须产出满足这一标准的解释,这可能需要在基础模型之上使用额外工具(SHAP 值、LIME、基于注意力的解释)。
分布偏移:在历史数据上训练的 AI 模型在市场条件、客户人口统计或经济条件发生变化时可能表现不同。在疫情前数据上训练的信贷模型在疫情期间表现不佳——但这种失败是渐进的,从总体性能指标中并不能立即看出。金融 AI 治理必须包含分布偏移监控:跟踪模型输入的分布是否偏离训练分布,作为性能退化的先行指标。
供应商模型不透明性:许多金融服务 AI 产品基于供应商管理的模型,机构无法完全访问训练数据、模型架构或验证结果。SR 11-7 要求机构对供应商模型进行适当的尽职调查,不能将模型风险管理完全委托给供应商。如果你的 AI 供应商无法提供充分的模型文档,你就无法按 SR 11-7 标准验证模型——你可能无法将其用于重大决策。
模型变更管理:云 AI API 在没有与 SR 11-7 要求相当的正式变更控制流程的情况下更新其模型。当 API 提供商更新你端点背后的模型时,你可能在生产中运行的是与验证过的不同的模型。这是模型风险管理的失败——你在运行未经验证的模型。要求变更通知和测试窗口的合同条款可以解决这个问题,或者完全拥有模型可以彻底消除它。
有效质疑要求
SR 11-7 的有效质疑要求是 AI 部署中最常被违反的治理结构。构建或使用模型的团队不应该是验证它的团队。验证者必须:
- 在组织上独立于模型开发团队
- 有权访问模型文档、训练数据和性能记录
- 有权要求模型变更或撤回批准
- 有资源进行有意义的独立测试
对于 AI 系统,有效质疑要求验证者能够在独立测试数据上重新运行模型,对训练流水线有足够的了解以识别概念合理性问题,并评估跨人口统计子组的性能以用于公平借贷目的。
实践实施:明确定义验证功能(内部模型风险组、外部验证者或组合)。定义开发团队必须向验证者提供什么文档。按风险等级建立验证时间表(高风险模型:年度;中等:两年一次)。记录验证发现、管理层回应和整改时间表。
公平借贷和算法偏见
用于信贷决策的 AI 受 ECOA(平等信贷机会法)和公平住房法约束,禁止基于受保护特征的信贷歧视。CFPB 和联邦银行监管机构期望金融机构监控 AI 信贷模型的差异影响——当模型产出不成比例地损害受保护群体的结果时,即使没有歧视意图。
AI 模型的公平借贷治理要求:
差异影响测试:在部署前和定期间隔内,测试模型在受保护类别(种族/民族、性别、国籍、年龄)中的输出,以识别不成比例的结果。"差异影响"的阈值遵循公平借贷先例——通常差异影响比率达到 80% 或更高时触发审查。
代理变量分析:AI 模型可以学习使用与受保护特征相关的代理变量(邮政编码、姓名、购物模式)。治理必须包括分析模型是否通过代理有效地使用了禁止的特征。
不利行动解释:确保模型能够产出不利行动通知,识别 Regulation B 要求的信贷拒绝的具体、准确原因。通用解释("算法因素")可能不满足监管标准。
子组性能监控:按人口统计子组分别跟踪模型性能(准确率、假阳性率、假阴性率)作为持续监控的一部分。组间性能差异是偏见信号。
金融 AI 的人在回路要求
对于高风险金融决策,人在回路结构既是治理要求也是风险管理实践。
信贷决策:边缘地带的自动信贷决策(临界申请人)应包含人工审查。定义需要人工审查的分数范围或风险等级。极端情况下的自动决策(明确可批准或明确应拒绝)风险较低;边缘群体是 AI 错误最可能发生且后果最严重的地方。
市场风险和交易:AI 辅助交易系统应具有人工监督机制,能够识别和中断异常行为。2010 年闪电崩盘是参考案例——没有有意义人工监督的自动化系统可以迅速放大市场波动。
欺诈和反洗钱:AI 生成的欺诈警报和反洗钱可疑活动报告在提交可疑活动报告(SAR)之前需要人工审查。无论警报是如何生成的,BSA 对有意义 审查的要求都适用。
模型输出监控:将审查 AI 模型输出质量的责任分配给特定功能。这与验证不同——这是在正式验证周期之间检测性能退化的持续运营监控。
审计追踪规范
金融服务 AI 审计追踪必须同时满足内部模型风险管理和监管审查要求。重大决策的每次 AI 查询的最少字段:
| 字段 | 值 |
|---|---|
| 决策 ID | 每个申请或交易唯一 |
| 时间戳 | UTC |
| 模型 ID | 清单中的具体模型版本 |
| 输入 摘要 | 驱动输出的关键变量(信贷模型的 SHAP 值) |
| 模型输出 | 评分、建议或分类 |
| 决策结果 | 批准 / 拒绝 / 转交审查 |
| 人工审查员 | 如适用,审查员身份和决策 |
| 不利行动代码 | 用于信贷拒绝 |
保留期限:ECOA 要求信贷申请记录保留 25 个月;BSA 记录 5 年。AI 决策记录应匹配底层交易保留要求。
供应商模型尽职调查
对于在重大金融决策中使用模型的 AI 供应商,SR 11-7 要求你的机构无法从黑盒供应商那里完全获得的文档。至少要求:
- 模型开发文档(方法论、训练数据描述、验证历史)
- 按人口统计子组的性能指标(用于公平借贷相关模型)
- 第三方验证报告(如有)
- 数据处理和安全实践(SOC 2、ISO 27001)
- 变更通知流程和版本控制实践
- 合同承诺提供模型文档以供审查
如果供应商无法为模型风险管理提供充分的文档,你不能将该模型用于 SR 11-7 监管的决策。这在审查员面前是没有谈判余地的。
模型所有权优势
对于拥有自己微调模型的金融机构,几个 SR 11-7 治理挑战显著简化:
- 变更管理:模型版本在你的控制之下。你决定何时更新。验证由你的决策触发,而非供应商的 API 更新。
- 文档完整性:你可以访问训练数据、模型架构和性能指标。验证文档可以完整。
- 可解释性:你可以用适合你用例的可解释性工具检测模型。
- 审计追踪:推理在你的基础设施上运行,与你现有的审计日志集成。
拥有模型的治理开销高于使用云 API——但这是正确类型的开销,与 SR 11-7 的要求一致而非冲突。
Ertas Data Suite 为金融服务组织提供完整的审计追踪、操作员级日志和本地推理,数据主权和模型文档是不可妥协的。对于微调流水线,Ertas Studio 处理在你的数据上训练并导出为可部署的 GGUF 格式。
Ship AI that runs on your users' devices.
Early bird pricing starts at $14.50/mo — locked in for life. Plans for builders and agencies.
Keep reading

AI Governance Framework for Healthcare: HIPAA, FDA SaMD, and Clinical Oversight Requirements
A practical AI governance framework for healthcare organizations. Covers HIPAA compliance, FDA Software as a Medical Device requirements, clinical human-in-the-loop design, and audit trail specifications.

AI Governance Framework for Law Firms: Privilege, Supervision, and Model Accountability
Law firms face unique AI governance requirements: attorney-client privilege, supervisory rules, confidentiality obligations, and court expectations around AI-assisted work product. Here's how to build the framework.

AI Governance Framework for Construction and Engineering: Safety, Liability, and Professional Accountability
Construction and engineering AI governance is driven by safety obligations, professional engineer liability, and the high-stakes nature of physical infrastructure decisions. Here's the framework for responsible deployment.