
如何创建用于微调的工具调用训练数据集
微调指南中最大的空白:没人讲如何实际构建数据集。以下是从模式文档到合成扩展到 JSONL 格式化的逐步过程——含 5 工具客服代理的真实示例。
每个微调工具调用模型的 指南都假设你已经有了数据。"只需准备 JSONL 格式的训练数据集",然后直接跳到训练命令。
这跳过了最难的部分。构建高质量工具调用数据集是 80% 的工作。
目标:5 工具客服代理
lookup_order— 按订单 ID 或邮箱查找订单check_status— 获取订单当前状态initiate_refund— 启动退款流程update_address— 更改配送地址escalate_to_human— 转接人工
步骤 1:记录工具模式
每个工具需要精确的 JSON 模式。描述比名称更重要——模型从描述学习何时调用工具。
步骤 2:生成种子示例
每个工具手写 10-20 条用户消息。手写这些。 不要为种子示例使用 LLM。
步骤 3:合成扩展
使用前沿模型将种子集扩展到每工具 50-100+ 变体。
步骤 4:添加负面示例
大多数人跳过这一步——这是大多数微调工具调用模型过度触发的原因。目标 20% 数据集为负面示例。包含近似消息(接近某工具但不完全触发)。
步骤 5:格式化为 JSONL
每行一个 JSON 对象。参数是 JSON 字符串而非嵌套对象。系统消息在所有示例中相同。
训练前质量检查
- 模式合规性
- 参数验证
- 平衡检查(每工具约 100 示例 + 125 负面)
- 边缘案例覆盖
多轮序列
包含 20-30 个多轮对话序列——客户查找订单、检查状态、然后请求退款——全在一个对话中。
总时间:5 工具代理 4-8 小时。总示例:500-750。7B 模型 LoRA 训练时间:20-40 分钟。
数据集就是模型。构建好它。
Ship AI that runs on your users' devices.
Free plan with 30 credits/mo, no card required. Paid plans from $25/mo USD.
延伸阅读
Ship AI that runs on your users' devices.
Free plan with 30 credits/mo, no card required. Paid plans from $25/mo USD.
Keep reading

用你的微调本地模型替换 OpenAI Agents SDK 中的 OpenAI
OpenAI Agents SDK 刻意保持模型无关。把 OpenAI 客户端换成在 Ollama 上运行的 Ertas 训练模型,你保留开发体验同时干掉按 token 成本。一份直接替换教程。

Pydantic AI 设备端:微调 Qwen3-4B 打造类型安全的移动智能体
Pydantic AI 为 LLM 智能体带来类型安全与 FastAPI 工程美感。把它与一个通过 llama.cpp 在设备端运行的微调 4B 模型组合起来,你将在移动应用中获得生产级智能体——零 API 成本,且输出按构造经过验证。

Llama Stack 装进手机:用微调 Llama 4 模型打造自托管 Llama 智能体
Meta 的 Llama Stack 是基于 Llama 的智能体的标准参考架构。把它与微调的 Llama 4 衍生模型以及 Swift/Kotlin 客户端 SDK 结合,你就得到了完全运行在用户手机上的完整智能体技术栈。