
微调RAG提示工程决策框架segment:agency
何时不该微调:RAG、提示或API更好的5种情况
关于微调何时是错误方法的诚实指南——涵盖五种常见场景,其中RAG、提示工程或API调用以更少的精力提供更好的结果。
EErtas Team·
Ertas是一个微调平台。我们构建它是因为微调解决了提示和RAG无法解决的真实问题。但我们也看到团队花数周微调模型用于更简单方法本可以更好解决的任务。那是浪费的时间和金钱。
我们宁愿你用正确的方法成功,也不愿你用微调失败。以下是五种你不应该微调的情况——以及应该怎么做。
情况1:你的知识库频繁变化
场景: 你在为电商公司构建客服机器人。产品目录、定价、退货政策每周变化。
为什么微调在这里是错的: 微调在训练时将知识烘焙到模型中。要保持模型最新,你需要每次变化都重新训练。
替代方案:RAG。 检索增强生成在查询时从知识库检索相关文档。更新文档,模型在每次请求时看到当前信息而无需重新训练。
情况2:你需要模型引用来源
场景: 你在为咨询公司构建研究助手。每个声明必须可追溯到来源。
为什么微调在这里是错的: 微调模型将信息吸收到权重中。它无法指向支持其输出的特定文档。
替代方案:带检索元数据的RAG。 RAG系统从已识别的文档中检索特定文本块,每个块携带元数据。引用是真实的。