
律所为何不会将客户数据发送给ChatGPT(以及他们真正想要什么)
律师-客户特权使云端AI对大多数律所来说是不可行的。以下是本地部署微调AI模型成为唯一可行路径的原因——以及能交付这些方案的机构面临的机遇。
律所不是接受新技术慢的机构。他们是谨慎的采用者——有充分的理由。当一家中型律所的合伙人评估用于文档审查的AI工具时,第一个问题不是关于准确性或速度,而是关于特权。
律师-客户特权是法律实践的基础。它是绝对的,且可通过向第三方披露而被放弃。一旦客户数据触及云端AI提供商的服务器,律所就面临一个合理的问题:特权是否已被损害?
这不是偏执,是风险管理。这也是为什么 最有可能采用AI的律所正是那些要求本地部署的律所。
云端AI的特权问题
律师-客户特权保护律师和其客户之间的通信不被披露。该保护的存在是为了鼓励客户对律师完全坦诚。它是普通法中最古老的法律原则之一。
特权可以被放弃——有意或无意——通过向第三方披露特权信息。当律所将客户文档发送给OpenAI的API进行分析时,会发生几件事:
数据被传输到第三方服务器。 OpenAI、Anthropic和Google不是律师-客户关系的当事方。将客户数据发送到他们的服务器构成向第三方的披露。
数据保留不确定。 即使有企业协议,云端AI提供商可能为滥用监控、调试或模型改进而保留输入。律所无法独立验证数据已被删除。
子处理商增加了风险层级。 云端AI提供商使用基础设施提供商、监控服务和内容安全系统来处理数据。每一个都是额外的第三方。
律所无法控制审计追踪。 在特权挑战事件中,律所无法提供关于客户数据如何被云提供商处理的确定性证据。
美国律师协会 正式意见477R要求律师在使用技术时做出"合理努力"以防止客户信息的无意披露。许多州律师协会发布了更具体的指导。共识正在转向将云端AI视为特权数据的高风险渠道。
律所真正想要什么
与积极评估AI的律所的对话揭示了一组一致的需求:
1. 本地部署
模型在律所控制的硬件上运行——无论是在自己的服务器机房还是在没有共享基础设施的私有云租户中。没有数据离开律所的网络边界。
2. 针对法律任务的微调
通用语言模型会虚构法律引文并忽略管辖区差异。律所需要针对其特定执业领域训练的模型——并购的合同审查、医疗法的监管合规、诉讼的案例分析。在领域特定数据上微调较小的模型显 著优于提示通用模型。
3. 可审计和可解释
每次推理都必须被记录。律所需要知道什么数据被处理、何时处理、由谁处理,以及模型产生了什么。这不是可选的——在许多司法管辖区这是监管要求。
4. 客户特定的数据隔离
服务多个客户的律所需要绝对的数据隔离。客户A的训练数据和推理请求绝不能被服务客户B的流程访问。这与传统执业中的利益冲突屏障原则相同,只是应用于AI基础设施。
5. 无供应商锁定
律所希望拥有模型。他们不想要供应商可以更改定价、条款或功能的SaaS依赖。导出为标准格式(GGUF、SafeTensors)是硬性要求。