prompt-engineeringfine-tuningmigrationguidesegment:agency

从提示词工程到微调：迁移实战手册

从提示词工程迁移到微调的实用手册——何时做出切换、如何将提示词转化为训练数据，以及分步迁移过程。

EErtas Team·March 5, 2026

你有一个花了数周打磨的系统提示词。它有 2,000 个 token，塞满了示例、边缘情况指令和格式规则。它能用——基本上。但它脆弱、昂贵，且以持续消耗时间的方式不一致。

这是将该提示词迁移到微调模型的实战手册。分五步，团队已用此方法降低 60-80% 的成本同时提升输出一致性。

迁移过程：五个步骤

步骤 1：记录当前提示词和预期行为

冻结当前系统。记录 50-100 个代表性输入及其实际输出。

步骤 2：从提示词中提取训练数据

提示词中的每个示例都是等待提取的训练样本。逐行审查提示词，为每条指令创建 10-20 个输入-输出对。

步骤 3：生成 1,000-2,000 个额外示例

使用当前提示词 + API 组合生成 3,000-5,000 个输出。严格过滤——只保留质量达标的输出。

步骤 4：微调较小的模型

Llama 3.1 8B 或 Qwen 2.5 7B，LoRA rank 16-32，2-4 个 epoch。在 Ertas Studio 上 30-90 分钟。

步骤 5：严格对比质量

对比准确率（通常提高 5-15 个百分点）、一致性（微调行为更稳定）、延迟（减少 30-50%）和成本（通常降低 10-50 倍）。

成本对比实例

指标	提示词 + GPT-4o	微调 Llama 8B
系统提示词	1,800 token	0 token
平均请求成本	$0.024	$0.001
月度成本（3,000 请求/天）	$2,160	$90（自托管）
准确率	83%	91%
一致性（重试相同输出）	78%	97%

微调模型训练成本 $40，不到两天就收回成本。

Ship AI that runs on your users' devices.

Free plan with 30 credits/mo, no card required. Paid plans from $25/mo USD.

or view pricing →

Ship AI that runs on your users' devices.

Free plan with 30 credits/mo, no card required. Paid plans from $25/mo USD.

or view pricing →

Keep reading

微调用合成数据：如何生成真正有效的训练数据

微调用合成数据：如何生成真正有效的训练数据

生成微调用合成训练数据的实用指南——涵盖提示策略、质量过滤、分布匹配以及混合真实和合成数据的 80/20 法则。

提示词工程有天花板。接下来是什么。

提示词工程有天花板。接下来是什么。

提示词工程可以带你走很远——但每个机构和开发者最终都会撞墙。以下是天花板长什么样、为什么存在，以及之后的技术路线。

Fine-Tuning 与 Prompt Engineering 在法律文档审查中的对比

Fine-Tuning 与 Prompt Engineering 在法律文档审查中的对比

Prompt engineering 在法律 AI 任务中何时会达到瓶颈？合同审查中 prompt engineering 与 fine-tuning 的实用对比，附带适用于代理机构的决策框架。