Back to blog
    提示词工程有天花板。接下来是什么。
    prompt-engineeringfine-tuningagencysolutions-architectsegment:agency

    提示词工程有天花板。接下来是什么。

    提示词工程可以带你走很远——但每个机构和开发者最终都会撞墙。以下是天花板长什么样、为什么存在,以及之后的技术路线。

    EErtas Team·

    提示词工程是真实且有价值的。但它有天花板。每个从业者最终都会触及,突破天花板的机构和开发者会构建根本更好的产品。

    触及天花板的迹象

    • 尽管有大量指令,输出风格仍然不对
    • 模型不知道你客户的术语
    • 准确率在领域特定任务上停滞
    • 延迟和成本不可持续
    • 上下文窗口限制成为结构性约束

    天花板之后的技术栈

    1. 微调

    直接修改模型权重以学习新行为。解决提示词无法解决的结构性问题——领域术语、行为一致性、准确率提升 15-30 个百分点。

    2. RAG

    动态注入知识库中的相关上下文。解决事实信息的"模型不知道这个"问题。

    3. 微调 + RAG 结合

    许多生产系统同时使用两者。微调模型带来正确的行为模式;RAG 带来当前的事实上下文。

    4. 结构化输出 + 工具使用

    解决格式一致性和外部数据访问问题。

    实用决策框架

    如果问题是...解决方案是...
    模型不遵循输出格式结构化输出 / JSON schema 强制
    模型不知道当前事实RAG
    模型使用错误术语微调
    准确率尽管优化提示词仍停滞微调
    提示词在规模上太长太贵微调以减少少样本示例

    商业启示

    微调的机构与客户有根本不同的对话。"我们的模型在你的数据上验证达到 X% 准确率「是与」我们有一个非常好的系统提示词"完全不同的推介。


    Ship AI that runs on your users' devices.

    Ertas early bird pricing starts at $14.50/mo — locked in for life. Plans for builders and agencies.

    Ship AI that runs on your users' devices.

    Early bird pricing starts at $14.50/mo — locked in for life. Plans for builders and agencies.

    Keep reading