tool-callingtraining-datafine-tuningai-agentstutorialdataset

如何创建用于微调的工具调用训练数据集

微调指南中最大的空白：没人讲如何实际构建数据集。以下是从模式文档到合成扩展到 JSONL 格式化的逐步过程——含 5 工具客服代理的真实示例。

EErtas Team·February 25, 2026

每个微调工具调用模型的指南都假设你已经有了数据。"只需准备 JSONL 格式的训练数据集"，然后直接跳到训练命令。

这跳过了最难的部分。构建高质量工具调用数据集是 80% 的工作。

目标：5 工具客服代理

lookup_order — 按订单 ID 或邮箱查找订单
check_status — 获取订单当前状态
initiate_refund — 启动退款流程
update_address — 更改配送地址
escalate_to_human — 转接人工

步骤 1：记录工具模式

每个工具需要精确的 JSON 模式。描述比名称更重要——模型从描述学习何时调用工具。

步骤 2：生成种子示例

每个工具手写 10-20 条用户消息。手写这些。 不要为种子示例使用 LLM。

步骤 3：合成扩展

使用前沿模型将种子集扩展到每工具 50-100+ 变体。

步骤 4：添加负面示例

大多数人跳过这一步——这是大多数微调工具调用模型过度触发的原因。目标 20% 数据集为负面示例。包含近似消息（接近某工具但不完全触发）。

步骤 5：格式化为 JSONL

每行一个 JSON 对象。参数是 JSON 字符串而非嵌套对象。系统消息在所有示例中相同。

训练前质量检查

模式合规性
参数验证
平衡检查（每工具约 100 示例 + 125 负面）
边缘案例覆盖

多轮序列

包含 20-30 个多轮对话序列——客户查找订单、检查状态、然后请求退款——全在一个对话中。

总时间：5 工具代理 4-8 小时。总示例：500-750。7B 模型 LoRA 训练时间：20-40 分钟。

数据集就是模型。构建好它。

Ship AI that runs on your users' devices.

Free plan with 30 credits/mo, no card required. Paid plans from $25/mo USD.

or view pricing →

延伸阅读

Ship AI that runs on your users' devices.

Free plan with 30 credits/mo, no card required. Paid plans from $25/mo USD.

or view pricing →

Keep reading

用你的微调本地模型替换 OpenAI Agents SDK 中的 OpenAI

用你的微调本地模型替换 OpenAI Agents SDK 中的 OpenAI

OpenAI Agents SDK 刻意保持模型无关。把 OpenAI 客户端换成在 Ollama 上运行的 Ertas 训练模型,你保留开发体验同时干掉按 token 成本。一份直接替换教程。

Pydantic AI 设备端：微调 Qwen3-4B 打造类型安全的移动智能体

Pydantic AI 设备端：微调 Qwen3-4B 打造类型安全的移动智能体

Pydantic AI 为 LLM 智能体带来类型安全与 FastAPI 工程美感。把它与一个通过 llama.cpp 在设备端运行的微调 4B 模型组合起来，你将在移动应用中获得生产级智能体——零 API 成本，且输出按构造经过验证。

Llama Stack 装进手机：用微调 Llama 4 模型打造自托管 Llama 智能体

Llama Stack 装进手机：用微调 Llama 4 模型打造自托管 Llama 智能体

Meta 的 Llama Stack 是基于 Llama 的智能体的标准参考架构。把它与微调的 Llama 4 衍生模型以及 Swift/Kotlin 客户端 SDK 结合，你就得到了完全运行在用户手机上的完整智能体技术栈。