AI监督AI失败人在环中负责任AIAI治理

缺乏人工监督的AI失败成本：记录案例及教训

关于HITL的抽象论点不如具体数字有说服力。以下是记录在案的AI失败、它们的成本，以及允许其发生的人工监督缺口。

EErtas Team·March 5, 2026

本文用五个记录在案的AI失败案例来说明具体案例。

案例1：Amazon招聘AI（2014-2018）

系统学会了惩罚包含"女性"一词的简历。运行四年无人发现。

案例2：Epic脓毒症预测算法

部署在数百家医院，但在各临床环境中未经独立验证就被信任。

案例3：COMPAS再犯风险评分

黑人被告被标记为高风险的错误率是白人被告的近两倍。

案例4：Knight Capital算法交易（2012）

45分钟内损失4.4亿美元。公司四个月后被出售。

案例5：加航聊天机器人（2024）

给出错误的丧亲机票政策信息。法院裁定公司对AI系统的说法负责。

规律

在所有五个案例中，失败模式一致：AI犯了错（AI总是犯错），而没有系统来在错误造成伤害之前捕获它们。

案例	监督缺口	审查本可捕获的问题
Amazon	无拒绝模式分析	几周内发现性别相关拒绝率
Knight Capital	无行为断路器	几分钟内发现异常交易活动
加航	无政策问题升级路径	交付前发现不正确的政策声明

每个案例中，监督机制在技术上都不困难。失败不是工程问题。而是治理选择。

Ship AI that runs on your users' devices.

Free plan with 30 credits/mo, no card required. Paid plans from $25/mo USD.

or view pricing →

Keep reading

高风险决策中AI辅助与AI自主的区别

高风险决策中AI辅助与AI自主的区别

AI辅助增强人类判断。AI自主替代人类判断。两者之间的界线是问责制所在——大多数AI部署对自己站在哪边没有清晰的答案。

为什么'我们使用API'意味着你在生产中无法控制你的AI

为什么'我们使用API'意味着你在生产中无法控制你的AI

每个依赖云AI API的团队都悄然将AI行为的控制权外包了出去。以下是当模型在别人的基础设施中运行时你究竟放弃了什么。

什么是AI模型卡？为什么EU AI Act使其成为非可选项

什么是AI模型卡？为什么EU AI Act使其成为非可选项

模型卡记录AI系统的训练内容、擅长什么、哪里失败以及针对谁测试。EU AI Act的附录IV使此文档成为法律要求。