
fine-tuningprompt-engineering法律文档审查segment:agency
Fine-Tuning 与 Prompt Engineering 在法律文档审查中的对比
Prompt engineering 在法律 AI 任务中何时会达到瓶颈?合同审查中 prompt engineering 与 fine-tuning 的实用对比,附带适用于代理机构的决策框架。
EErtas Team·
每家构建法律 AI 工具的 AI 代理机构都从 prompt engineering 开始。它速度快,不需要训练数据,在通用任务上表现出色。但当 客户要求在其特定文档类型上实现更高精度时,prompt engineering 就会遇到无论多么巧妙的提示都无法突破的瓶颈。
本文以合同审查——最常见的法律 AI 用例之一——为案例,对两种方法进行正面对比,并提供一个决策框架帮助判断何时该转向 fine-tuning。
Prompt Engineering 适用的场景
Prompt engineering 是正确的起点。对于有明确输出的通用法律任务,精心设计的提示配合前沿模型(GPT-4o、Claude Sonnet)可以提供良好的结果:
适合 prompt engineering 的用例:
- 总结公开的判例法
- 从模板生成标准法律文件初稿
- 回答通用法律问题(非案件特定)
- 将文件分类为大类(合同、动议、摘要、信函)
对于这些任务,模型的预训练知识能很好地覆盖该领域。提示提供结构和约束。结果对于律师审查的初步筛选来说是可以接受的。