Back to blog
    结构化输出微调:超越 JSON Mode 实现有保障的 Schema
    fine-tuningstructured-outputjsonschemasegment:developer

    结构化输出微调:超越 JSON Mode 实现有保障的 Schema

    JSON mode 给您有效的 JSON。微调给您有保障的 Schema 合规——每个字段、每个类型、每次。以下是如何训练模型输出您应用期望的精确结构。

    EErtas Team·

    您的应用期望一个有 8 个字段的 JSON 对象。GPT-4 大多数时候给您想要的。但在 95% Schema 合规率下,每 20 次 API 调用有 1 次产生解析器无法处理的输出。每天 10,000 次调用意味着每天 500 次失败。

    微调后 Schema 合规从 95% 提示到 99.5%+ 微调。

    结构化输出层级

    级别方案合规率
    1基于提示80-90%
    2JSON Mode95-98%
    3Function Calling API99%+
    4微调模型99.5-99.9%
    5微调 + 约束解码100%

    构建 Schema 合规训练数据集

    1. 定义正式 JSON Schema
    2. 生成 500-1,000 个验证通过的训练示例
    3. 变化输入而非仅输出
    4. 显式包含边缘情况(空数组、null、长字符串)
    5. 格式化为训练对——助手回复必须是纯 JSON,无 markdown

    常见错误

    1. 训练数据不一致——每个格式约定必须 100% 一致
    2. 未训练空/null 情况
    3. 输入过于同质
    4. 在美化 JSON 上训练(浪费 token)
    5. 未验证训练数据

    对比指标

    设置Schema 合规平均延迟每千次费用
    GPT-4o + 提示93-96%1.8s$2.50-8.00
    微调 8B + 语法约束100%0.35s$0(本地)

    Ship AI that runs on your users' devices.

    Ertas early bird pricing starts at $14.50/mo — locked in for life. Plans for builders and agencies.

    延伸阅读

    Ship AI that runs on your users' devices.

    Early bird pricing starts at $14.50/mo — locked in for life. Plans for builders and agencies.

    Keep reading