
提示词工程有天花板。接下来是什么。
提示词工程可以带你走很远——但每个机构和开发者最终都会撞墙。以下是天花板长什么样、为什么存在,以及之后的技术路线。
提示词工程是真实且有价值的。但它有天花板。每个从业者最终都会触及,突破天花板的机构和开发者会构建根本更好的产品。
触及天花板的迹象
- 尽管有大量指令,输出风格仍然不对
- 模型不知道你 客户的术语
- 准确率在领域特定任务上停滞
- 延迟和成本不可持续
- 上下文窗口限制成为结构性约束
天花板之后的技术栈
1. 微调
直接修改模型权重以学习新行为。解决提示词无法解决的结构性问题——领域术语、行为一致性、准确率提升 15-30 个百分点。
2. RAG
动态注入知识库中的相关上下文。解决事实信息的"模型不知道这个"问题。
3. 微调 + RAG 结合
许多生产系统同时使用两者。微调模型带来正确的行为模式;RAG 带来当前的事实上下文。
4. 结构化输出 + 工具使用
解决格式一致性和外部数据访问问题。
实用决策框架
| 如果问题是... | 解决方案是... |
|---|---|
| 模型不遵循输出格式 | 结构化输出 / JSON schema 强制 |
| 模型不知道当前事实 | RAG |
| 模型使用错误术语 | 微调 |
| 准确率尽管优化提示词仍停滞 | 微调 |
| 提示词在规模上太长太贵 | 微调以减少少样本示例 |
商业启示
微调的机构与客户有根本不同的对话。"我们的模型在你的数据上验证达到 X% 准确率「是与」我们有一个非常好的系统提示词"完全不同的推介。
Ship AI that runs on your users' devices.
Ertas early bird pricing starts at $14.50/mo — locked in for life. Plans for builders and agencies.
Ship AI that runs on your users' devices.
Early bird pricing starts at $14.50/mo — locked in for life. Plans for builders and agencies.
Keep reading

90% Gross Margin AI Services: The Agency Model That Beats SaaS Economics
Most AI agencies run 50-60% gross margins because they're reselling API calls. Agencies using fine-tuned models on owned infrastructure hit 90%+ margins. Here's how the economics work.

White-Label AI Agents: How Agencies Ship Custom Models Under Client Brands
Your clients want AI that feels like theirs, not yours. White-label AI agents — custom fine-tuned models deployed under client branding — let agencies deliver differentiated products at scale.

How to QA a Fine-Tuned Model Before Client Delivery
A complete QA process for testing fine-tuned models before delivering them to clients — covering functional testing, edge cases, regression checks, and client acceptance criteria.