Back to blog
    金融服务业 AI 治理框架:SR 11-7、模型风险与监管预期
    ai-governancefinancial-services-aisr-11-7model-riskhuman-in-the-loopregulated-industries

    金融服务业 AI 治理框架:SR 11-7、模型风险与监管预期

    金融服务 AI 治理受 SR 11-7、OCC 指导以及日益增长的 EU AI Act 约束。以下是如何构建满足审查员预期的模型风险管理框架。

    EErtas Team·

    金融服务 AI 治理有着完善的监管基础。SR 11-7——美联储关于模型风险管理的指导——自 2011 年起管辖定量模型验证,并直接适用于在重大金融决策中使用的 AI 系统。OCC 公告 2011-12 对国民银行提出了同等要求。CFPB 的公平借贷指导适用于用于信贷决策的 AI。而 EU AI Act 的高风险分类涵盖了大多数影响消费者权益的金融 AI。

    这不是一个新兴的监管领域。金融监管机构有明确的预期。审查员正在询问 AI 治理问题。问题不在于你的 AI 是否需要治理框架——而在于你的框架是否满足监管标准。


    SR 11-7:模型风险管理基础

    SR 11-7 将模型定义为"应用统计、经济、金融或数学理论、技术和假设来处理输入数据以产生定量估计的定量方法、系统或方法"。在信贷、风险、交易和合规功能中使用的大多数 AI 系统完全属于这一定义范围。

    SR 11-7 的三项要求适用于 AI 模型:

    模型开发和实施:银行必须了解模型的概念合理性、用于开发模型的数据质量、执行的测试和局限性。对于 AI 模型,这意味着记录训练数据来源、验证方法论、性能指标和已知故障模式——不仅仅是基准测试性能。

    模型验证:对模型概念合理性、数据质量和性能的独立审查。关键的是,验证功能必须独立于模型开发和使用功能。SR 11-7 称之为"有效质疑"——在没有组织压力的情况下质疑模型假设、数据选择和性能声明。AI 模型需要与传统定量模型相同的独立性。

    治理和控制:对整个组织模型风险的管理层监督。这包括维护模型清单、跟踪模型变更、根据重要性定义风险等级(高/中/低),以及确保模型变更在部署前经过适当审查。


    模型清单要求

    在重大金融决策中使用的每个 AI 模型都必须在你的模型清单中。"重大"意味着输出影响信贷决策、风险评估、监管资本计算、交易决策或面向客户的建议。

    对于每个模型,清单应记录:

    • 模型名称和唯一标识符
    • 所有者(业务线)和开发者(内部或供应商)
    • 模型目的及其支持的决策
    • 基于重要性和复杂性的风险等级(高/中/低)
    • 模型类型(统计、ML、深度学习、LLM)
    • 训练数据描述和日期
    • 最后验证日期和结果
    • 当前状态(活跃 / 审查中 / 退役)
    • 已知局限性和批准的使用条件
    • 第三方供应商关系(如适用,包括供应商的模型文档义务)

    监管机构期望模型清单完整、及时且可供审查员访问。清单中的缺口——在生产中未被记录的模型——是重大的审查发现。


    金融服务中 AI 特有的治理挑战

    SR 11-7 是为统计模型编写的。AI 和机器学习系统带来了 2011 年指导未完全预见到的额外治理挑战,审查员越来越关注这些挑战。

    可解释性:传统统计模型(逻辑回归、评分卡模型)产生可解释的输出——你可以将信贷决策追溯到特定的输入变量及其系数。许多 AI 模型,特别是深度学习和大语言模型,原生不产生这种可解释性。对于消费者信贷决策,ECOA 和 Regulation B 要求不利行动通知识别拒绝的具体原因。用于信贷决策的 AI 系统必须产出满足这一标准的解释,这可能需要在基础模型之上使用额外工具(SHAP 值、LIME、基于注意力的解释)。

    分布偏移:在历史数据上训练的 AI 模型在市场条件、客户人口统计或经济条件发生变化时可能表现不同。在疫情前数据上训练的信贷模型在疫情期间表现不佳——但这种失败是渐进的,从总体性能指标中并不能立即看出。金融 AI 治理必须包含分布偏移监控:跟踪模型输入的分布是否偏离训练分布,作为性能退化的先行指标。

    供应商模型不透明性:许多金融服务 AI 产品基于供应商管理的模型,机构无法完全访问训练数据、模型架构或验证结果。SR 11-7 要求机构对供应商模型进行适当的尽职调查,不能将模型风险管理完全委托给供应商。如果你的 AI 供应商无法提供充分的模型文档,你就无法按 SR 11-7 标准验证模型——你可能无法将其用于重大决策。

    模型变更管理:云 AI API 在没有与 SR 11-7 要求相当的正式变更控制流程的情况下更新其模型。当 API 提供商更新你端点背后的模型时,你可能在生产中运行的是与验证过的不同的模型。这是模型风险管理的失败——你在运行未经验证的模型。要求变更通知和测试窗口的合同条款可以解决这个问题,或者完全拥有模型可以彻底消除它。


    有效质疑要求

    SR 11-7 的有效质疑要求是 AI 部署中最常被违反的治理结构。构建或使用模型的团队不应该是验证它的团队。验证者必须:

    • 在组织上独立于模型开发团队
    • 有权访问模型文档、训练数据和性能记录
    • 有权要求模型变更或撤回批准
    • 有资源进行有意义的独立测试

    对于 AI 系统,有效质疑要求验证者能够在独立测试数据上重新运行模型,对训练流水线有足够的了解以识别概念合理性问题,并评估跨人口统计子组的性能以用于公平借贷目的。

    实践实施:明确定义验证功能(内部模型风险组、外部验证者或组合)。定义开发团队必须向验证者提供什么文档。按风险等级建立验证时间表(高风险模型:年度;中等:两年一次)。记录验证发现、管理层回应和整改时间表。


    公平借贷和算法偏见

    用于信贷决策的 AI 受 ECOA(平等信贷机会法)和公平住房法约束,禁止基于受保护特征的信贷歧视。CFPB 和联邦银行监管机构期望金融机构监控 AI 信贷模型的差异影响——当模型产出不成比例地损害受保护群体的结果时,即使没有歧视意图。

    AI 模型的公平借贷治理要求:

    差异影响测试:在部署前和定期间隔内,测试模型在受保护类别(种族/民族、性别、国籍、年龄)中的输出,以识别不成比例的结果。"差异影响"的阈值遵循公平借贷先例——通常差异影响比率达到 80% 或更高时触发审查。

    代理变量分析:AI 模型可以学习使用与受保护特征相关的代理变量(邮政编码、姓名、购物模式)。治理必须包括分析模型是否通过代理有效地使用了禁止的特征。

    不利行动解释:确保模型能够产出不利行动通知,识别 Regulation B 要求的信贷拒绝的具体、准确原因。通用解释("算法因素")可能不满足监管标准。

    子组性能监控:按人口统计子组分别跟踪模型性能(准确率、假阳性率、假阴性率)作为持续监控的一部分。组间性能差异是偏见信号。


    金融 AI 的人在回路要求

    对于高风险金融决策,人在回路结构既是治理要求也是风险管理实践。

    信贷决策:边缘地带的自动信贷决策(临界申请人)应包含人工审查。定义需要人工审查的分数范围或风险等级。极端情况下的自动决策(明确可批准或明确应拒绝)风险较低;边缘群体是 AI 错误最可能发生且后果最严重的地方。

    市场风险和交易:AI 辅助交易系统应具有人工监督机制,能够识别和中断异常行为。2010 年闪电崩盘是参考案例——没有有意义人工监督的自动化系统可以迅速放大市场波动。

    欺诈和反洗钱:AI 生成的欺诈警报和反洗钱可疑活动报告在提交可疑活动报告(SAR)之前需要人工审查。无论警报是如何生成的,BSA 对有意义审查的要求都适用。

    模型输出监控:将审查 AI 模型输出质量的责任分配给特定功能。这与验证不同——这是在正式验证周期之间检测性能退化的持续运营监控。


    审计追踪规范

    金融服务 AI 审计追踪必须同时满足内部模型风险管理和监管审查要求。重大决策的每次 AI 查询的最少字段:

    字段
    决策 ID每个申请或交易唯一
    时间戳UTC
    模型 ID清单中的具体模型版本
    输入摘要驱动输出的关键变量(信贷模型的 SHAP 值)
    模型输出评分、建议或分类
    决策结果批准 / 拒绝 / 转交审查
    人工审查员如适用,审查员身份和决策
    不利行动代码用于信贷拒绝

    保留期限:ECOA 要求信贷申请记录保留 25 个月;BSA 记录 5 年。AI 决策记录应匹配底层交易保留要求。


    供应商模型尽职调查

    对于在重大金融决策中使用模型的 AI 供应商,SR 11-7 要求你的机构无法从黑盒供应商那里完全获得的文档。至少要求:

    • 模型开发文档(方法论、训练数据描述、验证历史)
    • 按人口统计子组的性能指标(用于公平借贷相关模型)
    • 第三方验证报告(如有)
    • 数据处理和安全实践(SOC 2、ISO 27001)
    • 变更通知流程和版本控制实践
    • 合同承诺提供模型文档以供审查

    如果供应商无法为模型风险管理提供充分的文档,你不能将该模型用于 SR 11-7 监管的决策。这在审查员面前是没有谈判余地的。


    模型所有权优势

    对于拥有自己微调模型的金融机构,几个 SR 11-7 治理挑战显著简化:

    • 变更管理:模型版本在你的控制之下。你决定何时更新。验证由你的决策触发,而非供应商的 API 更新。
    • 文档完整性:你可以访问训练数据、模型架构和性能指标。验证文档可以完整。
    • 可解释性:你可以用适合你用例的可解释性工具检测模型。
    • 审计追踪:推理在你的基础设施上运行,与你现有的审计日志集成。

    拥有模型的治理开销高于使用云 API——但这是正确类型的开销,与 SR 11-7 的要求一致而非冲突。

    预约 Ertas 发现通话 →

    Ertas Data Suite 为金融服务组织提供完整的审计追踪、操作员级日志和本地推理,数据主权和模型文档是不可妥协的。对于微调流水线,Ertas Studio 处理在你的数据上训练并导出为可部署的 GGUF 格式。

    Ship AI that runs on your users' devices.

    Early bird pricing starts at $14.50/mo — locked in for life. Plans for builders and agencies.

    Keep reading