Back to blog
    法律 AI 的人在迴路:為何律師審查不只是合規複選框
    human-in-the-looplegal-aiattorney-reviewlegal-techai-governance

    法律 AI 的人在迴路:為何律師審查不只是合規複選框

    律師協會、醫療事故保險公司和法院都在問同樣的問題:當 AI 出錯時誰負責?答案需要有意義的律師在迴路監督。

    EErtas Team·

    2023 年 5 月,兩位律師在紐約的聯邦法院提交了一份引用了六個案例的案件摘要。這些案例都不存在。它們是由 ChatGPT 生成的,產生了聽起來合理的引用——完整的案件名稱、報告員和頁碼——在 Westlaw 或 Lexis 中沒有任何對應。律師告訴法院他們沒有獨立驗證引用,假設 AI 的輸出是可靠的。法院對兩位律師都進行了制裁。

    那個案例被廣泛報道為技術失敗。它不是。而是 HITL 失敗。AI 做了生成式 AI 在沒有檢索增強生成的情況下被要求引用案例法時的事:它捏造了。律師有職業義務驗證引用。他們沒有。法律要求的人在迴路流程——以及醫療事故保險和律師倫理規則一直要求的——缺席了。

    技術改變了。職業義務沒有。

    律師協會指導實際上說了什麼

    到 2026 年,美國每個主要律師協會都就律師使用 AI 發布了正式指導。措辭不同,實質相同。

    ABA 模型規則 1.1 要求律師保持能力,ABA 倫理和職業責任常設委員會明確將其擴展到包括理解代理中使用的 AI 工具——包括其限制和失效模式。

    ABA 模型規則 5.1 使監督律師對下屬的工作負責。ABA 2023 年正式意見 512 澄清,AI 工具不是下屬——它們是工具——但它們產生的工作是律師的工作。監督責任不是通過運行 AI 並像合夥人略讀助理備忘錄一樣審查輸出來解除的。律師必須能夠驗證法律推理,而非只是格式。

    ABA 模型規則 5.3 適用於非律師協助。雖然 AI 在法定意義上不是非律師,但委員會已將規則關於監督的要求解釋為適用於 AI 生成的工作產品。律師不能免除對在事項中使用的 AI 輸出的責任。

    ABA 模型規則 1.6(保密性)對基於雲端的 AI 有額外影響:未經知情同意,不得向第三方披露客戶資料,將機密文件上傳到第三方 AI 服務可能構成披露。

    實際結果:使用 AI 且不獨立驗證輸出的律師,沒有履行其職業責任。「AI 告訴我的」在紀律程序中不是辯護理由。

    HITL 失敗造成責任的三個案例

    1. 在法院提交的幻覺引用

    2023 年的紐約案例是第一個廣泛報道的案例,但不是最後一個。此後,加利福尼亞州、德克薩斯州和多個聯邦地區的律師,因提交包含捏造引用、不存在法規或錯誤引用裁決的 AI 生成文件而受到制裁。

    在每個案例中,AI 輸出通過了膚淺的審查:引用看起來是真實的,格式是正確的,語言是自信的。有意義的 HITL——每個被引用權威的獨立 Westlaw 驗證——本可以發現每個錯誤。沒有律師執行那個檢查。

    2. 缺少條款的 AI 起草合約

    一家中型私募股權公司使用 AI 合約起草工具生成了一系列投資組合公司運營協議。AI 可靠地包含了標準條款。它省略了——在 14 份文件中始終如一——基金 LPA 要求的特定拖帶權條款。

    省略在簽署時沒有被發現。兩年後,在需要執行該條款的投資組合公司收購過程中,它浮出水面。缺失的條款使基金失去了在退出時強制少數股東同意的能力。醫療事故保險公司支付了賠償。公司失去了客戶。

    有交易經驗的人類律師審查協議的完整性——而非只是其中內容的正確性——本可以發現差距。發生的審查驗證了 AI 產生了什麼,而非它是否完整。

    3. 錯誤分類文件的 AI 生成特權日誌

    在商業訴訟事項中的大型文件審查,使用 AI 對 40 萬份文件進行特權分類。AI 在通用語料庫上訓練;它對此事項中的特定特權關係一無所知——某些公司高管為平行調查聘用了外部法律顧問,與這些律師的通信具有特權。

    AI 將這些通信分類為無特權的。847 份文件被提供給對方律師。隨後的特權放棄論點消耗了六個月的動議實踐。提供方最終以無意披露為由勝訴——但錯誤的成本遠遠超過適當結構化的特權日誌 HITL 審查的成本。

    有意義的律師審查是什麼樣的

    審查 AI 輸出和獨立驗證它之間存在差異。

    審查意味著閱讀 AI 產生的內容並評估它是否看起來正確。這是受到制裁的律師在引用案例中所做的。引用看起來正確。

    獨立驗證意味著對照權威來源核實每個事實或法律主張。對於法律引用,這意味著在 Westlaw 或 Lexis 中運行每個案例。對於合約條款,這意味著對照此交易類型所需條款的檢查清單進行比較。對於法律論點,這意味著獨立評估被引用的權威是否實際上支持被引用的主張。

    法律實踐中 HITL 的標準是獨立驗證,而非審查。差異不是語義上的。審查 AI 輸出的人類和獨立驗證它的人類,將以非常不同的速率發現不同的錯誤。

    風險最高的法律實踐領域

    刑事辯護:使用 AI 起草動議的公設辯護人,在錯誤直接影響人身自由的情境中工作。無效辯護律師索賠現在常規地包括關於 AI 生成的法律論點是否被獨立驗證的問題。

    併購盡職調查:摘要合約附表、標記重大不利變化條款並識別缺失陳述和保證的 AI 工具很有用——如果律師依賴摘要而非文件,則很危險。收購協議包含「重大」和「重大不利」之間的差異可以是 5000 萬美元賠償爭議的條款。

    移民申請:I-485、庇護申請和簽證申請包含事實問題,AI 生成的錯誤答案——即使是小的不準確——可能導致申請被拒、遣返程序或對未來移民利益的禁止。傷害通常是不可逆的,影響客戶留在該國的能力。

    特權問題

    律師-客戶特權保護客戶和其律師之間為獲取法律建議而進行的保密通信。它保護律師的工作產品——律師或為律師在預期訴訟中準備的文件。

    當 AI 做出獨立的法律判斷——分析文件、綜合法律標準、建議行動方案——而律師只是採納輸出而沒有獨立分析時,會出現特權問題。誰的思維印象反映在工作產品中?如果律師無法解釋文件中的推理,因為 AI 生成了它而他們沒有遵循推理——只有結論——工作產品原則的核心保護(律師的思維印象和法律理論)可能不適用。

    法院尚未完全解決這個問題。一些法院拒絕將工作產品保護擴展到律師全盤採納而沒有獨立分析的 AI 生成分析。安全立場是明確的:任何需要特權保護的文件中,必須反映的是律師的判斷,而非 AI 的。

    文件審查:HITL 應該如何運作

    大規模 AI 輔助文件審查是法律中最成熟和最可辯護的 HITL 應用之一——當正確執行時。

    可辯護的 AI 輔助審查流程包括:

    1. 律師設計的分類框架:類別和定義由具有事項專業知識的律師設置,而非從 AI 的通用訓練中導出。
    2. 訓練集驗證:律師審查和驗證用於在此事項特定文件上訓練分類器的種子集。
    3. 統計抽樣:律師審查每個類別的隨機樣本——包括預測不相關的——在生產前驗證模型性能。
    4. 持續校準:隨著文件被審查,律師定期抽查 AI 的分類。如果錯誤率超過閾值,模型被重新訓練。
    5. 律師對方法論的簽署:律師認證審查方法論,而非只是輸出。這是法院和對方律師在質疑文件生產時審查的內容。

    這些步驟都不需要律師審查每份文件。它們確實要求律師擁有流程。

    Ertas 的角度

    法律文件是任何組織中最敏感的資料之一。根據規則 1.6,將它們上傳到雲端 AI 服務進行標注、摘要或訓練資料準備,通常在倫理上是不允許的,從特權角度來看是危險的,有時合約禁止的。

    Ertas Data Suite 在本地運行。法律文件標注、分類和訓練資料準備在你的安全邊界內發生。領域專家——在律師事務所情境中意味著有事項專業知識的律師——直接在工具中標注和驗證資料。每個操作都記錄了時間戳和審查員身份。什麼都不離開建築物。

    對於建立用於文件審查、合約分析或監管研究的 AI 工具的律師事務所和法律部門,資料準備管道需要滿足與部署系統相同的保密要求。Ertas 就是為那個要求而建構的。

    有關企業 AI 中 HITL 的基礎框架,請參閱什麼是人在迴路 AI?。有關律師事務所為何對第三方 AI 服務格外謹慎的背景,請參閱我們關於法律 AI 保密要求的報道。

    預約與 Ertas 的探索通話 →

    律師對 AI 輸出的審查不是合規複選框。它是職業和倫理的底線。律師協會、法院和醫療事故保險公司都明確表達了他們的立場。你的律師事務所或法律部門的問題是,你的 AI 工作流程是否設計為支持真正的律師監督——還是設計為創造其外表。

    Turn unstructured data into AI-ready datasets — without it leaving the building.

    On-premise data preparation with full audit trail. No data egress. No fragmented toolchains. EU AI Act Article 30 compliance built in.

    Keep reading