
AI 稽核軌跡:你需要記錄什麼以及監管機構為何會要求
EU AI Act 第 30 條、HIPAA 技術保障措施和 SR 11-7 都要求 AI 系統維護詳細日誌。以下是你需要捕獲的確切內容及方法。
稽核軌跡不是關於記錄一切,而是關於事後能夠回答具體問題:做出了什麼決策、由什麼系統、基於什麼輸入、在什麼時間、有什麼人類監督,以及接下來發生了什麼。
歐盟、美國和英國的監管機構正在趨向類似的問題。他們可能使用不同的法律語言,但核心要求是相同的:如果你的 AI 做出了一個重要決策,你應該能夠完整地重建它。
大多數企業 AI 部署今天無法做到這一點。以下是你需要什麼,以及每個監管框架要求什麼。
法規實際上說了什麼
EU AI Act
EU AI Act 有三條直接涉及日誌要求:
第 13 條(透明度) 要求高風險 AI 系統足夠透明,讓部署者能夠適當地解讀和使用輸出。系統必須提供可解讀的輸出——不只是決策,而是決策的依據。
第 17 條(品質管理系統) 要求高風險 AI 系統的提供者實施包括記錄保存程序、資料治理和上市後監控的品質管理系統。品質管理系統本身必須被記錄並可稽核。
附錄 IV(技術文件) 規定了必須記錄的內容 :系統一般描述、設計和開發的詳細描述(包括訓練方法和訓練資料)、監控和評估措施,以及風險管理措施。這些文件必須維護並保持最新。
第 30 條 是最具體的日誌要求:高風險 AI 系統的提供者和部署者必須保存 AI 系統自動生成的日誌,期限適合預期用途,最少 10 年。日誌必須足以支持對決策的事後調查。
十年是很長的保留期。大多數工程團隊以週或月來考慮日誌保留。對於根據 EU AI Act 被分類為高風險的 AI 系統,義務長達十年。
HIPAA 技術保障措施 (45 CFR §164.312)
HIPAA 的技術保障要求適用於任何創建、接收、維護或傳輸電子受保護健康資訊 (ePHI) 的系統。如果你的 AI 系統接觸病患資料,以下適用:
- 存取控制:唯一使用者識別、自動登出、加密
- 稽核控制:記錄和檢查包含 ePHI 的資訊系統中活動的硬體、軟體和程序機制
- 完整性控制:驗證 ePHI 未被更改或銷毀的機制
- 傳輸安全:傳輸中的 ePHI 加密
這裡相關的是稽核控制要求。HIPAA 沒有規定具體記錄什麼,但 HHS 指導明確表示日誌應捕獲誰存取了什麼資料、何時以及為什麼。保留期:從創建或最後有效日期起 6 年。
SR 11-7(聯邦儲備 / OCC 模型風險管理)
聯邦儲備關於模型風險管理的 SR 11-7 指導要求銀行使用的模型具有涵蓋以下內容的文件:
- 模型目的和預期用途
- 理論和邏輯描述
- 資料輸入和假設
- 模型限制
- 驗證程序
- 持續性能監控
對於 AI/ML 模型,監管機構強調了記錄模型輸入、輸出和性能指標的重要性,以支持持續監控和失敗調查。關鍵原則是獨立驗證者必須能夠重現模型輸出——這需要推理時輸入和模型版本的完整日誌。
AI 稽核軌跡的 8 個最低要素
這八個要素涵蓋任何合規級 AI 稽核軌跡必須捕獲的最低要求。缺少任何一個都會創造監 管機構會發現的差距。
1. 帶完整性雜湊的輸入資料
記錄呈現給模型的輸入——如果原始輸入太大,則記錄其表示。關鍵是包含輸入資料的密碼雜湊(SHA-256 是標準)。這讓你以後能夠驗證記錄的輸入是否與實際處理的相符。沒有完整性雜湊,記錄的輸入記錄可能被質疑。
對於包含 ePHI 的輸入,記錄對資料記錄的引用而非資料本身——但確保引用是明確的且雜湊涵蓋引用的內容。
2. 模型版本和配置
這是最常見的缺失要素。記錄處理請求的確切模型版本:不只是「GPT-4」,而是具體版本、檢查點或模型 ID。包含推理配置:溫度、top-p、最大令牌數、系統提示雜湊。
如果你無法在歷史推理時指定確切的模型版本,你就無法重建系統在那個時間產生的行為。這對任何監管審查都是關鍵差距。