
prompt-engineeringfine-tuningagencysolutions-architectsegment:agency
提示词工程有天花板。接下来是什么。
提示词工程可以带你走很远——但每个机构和开发者最终都会撞墙。以下是天花板长什么样、为什么存在,以及之后的技术路线。
EErtas Team·
提示词工程是真实且有价值的。但它有天花板。每个从业者最终都会触及,突破天花板的机构和开发者会构建根本更好的产品。
触及天花板的迹象
- 尽管有大量指令,输出风格仍然不对
- 模型不知道你客户的术语
- 准确率在领域特定任务上停滞
- 延迟和成本不可持续
- 上下文窗口限制成为结构性约束
天花板之后的技术栈
1. 微调
直接修改模型权重以学习新行为。解决提示词无法解决的结构性问题——领域术语、行为一致性、准确率提升 15-30 个百分点。
2. RAG
动态注入知识库中的相关上下文。解决事实信息的"模型不知道这个"问题。
3. 微调 + RAG 结合
许多生产系统同时使用两者。微调模型带来正确的行为模式;RAG 带来当前的事实上下文。
4. 结构化输出 + 工具使用
解决格式一致性和外部数据访问问题。
实用决策框架
| 如果问题是... | 解决方案是... |
|---|---|
| 模型不遵循输出格式 | 结构化输出 / JSON schema 强制 |
| 模型不知道当前事实 | RAG |
| 模型使用错误术语 | 微调 |
| 准确率尽管优化提示词仍停滞 | 微调 |
| 提示词在规模上太长太贵 | 微调以减少少样本示例 |
商业启示
微调的机构与客户有根本不同的对话。"我们的模型在你的数据上验证达到 X% 准确率「是与」我们有一个非常好的系统提示词"完全不同的推介。
Ship AI that runs on your users' devices.
Free plan with 30 credits/mo, no card required. Paid plans from $25/mo USD.
Ship AI that runs on your users' devices.
Free plan with 30 credits/mo, no card required. Paid plans from $25/mo USD.


