phi-4microsoftfine-tuningenterpriseslmsegment:developer

微调 Phi-4：微软最佳企业任务小型模型

Phi-4 14B 在数学基准上超越 GPT-4，同时在本地硬件上运行速度快 15 倍。以下是如何为分类、提取和结构化输出任务微调它。

EErtas Team·March 15, 2026

微软 Phi-4 是一个 14B 参数模型，在 MATH 基准上得分 84.8%——高于 GPT-4 的 84.3%。一个小到可以在单个消费级 GPU 上运行的模型，在数学推理上超越了万亿参数模型。

为什么企业选 Phi-4

**数学推理：**MATH 84.8%，GSM8K 93.2%
**结构化输出：**开箱即用 96% JSON Schema 合规性
**指令跟随：**可靠追踪多部分指令
**代码生成：**HumanEval 82.6%

最佳企业用例

金融文档处理

微调后：96% 收入表行项提取准确率，98% 数值计算准确率。

复杂分类法分类

32 类支持工单分类：Phi-4 94%，Llama 3.3 8B 89%，GPT-4o 87%。

结构化数据提取

合同条款提取：Phi-4 93% 字段级准确率，97% JSON 有效性。

量化推荐

量化	准确率	JSON 有效性	模型大小
Q5_K_M	92.8%	96.8%	10 GB
Q4_K_M	92.1%	96.2%	8.5 GB

Q5_K_M 比 FP16 仅损失 0.4% 准确率，快 73%，小 64%。

Ship AI that runs on your users' devices.

Free plan with 30 credits/mo, no card required. Paid plans from $25/mo USD.

or view pricing →

延伸阅读

Ship AI that runs on your users' devices.

Free plan with 30 credits/mo, no card required. Paid plans from $25/mo USD.

or view pricing →

Keep reading

微调 Gemma 3：Google 为端侧部署优化的轻量模型

微调 Gemma 3：Google 为端侧部署优化的轻量模型

Gemma 3 为端侧推理优化——手机、平板、边缘硬件。以下是如何为无需服务器运行的移动 AI 功能和 IoT 应用微调它。

微调 Qwen 2.5 用于多语言应用

微调 Qwen 2.5 用于多语言应用

Qwen 2.5 覆盖 29 种语言，18 万亿训练 token。以下是如何为多语言分类、支持和内容生成微调它——无需每种语言单独模型。

结构化输出微调：超越 JSON Mode 实现有保障的 Schema

结构化输出微调：超越 JSON Mode 实现有保障的 Schema

JSON mode 给您有效的 JSON。微调给您有保障的 Schema 合规——每个字段、每个类型、每次。以下是如何训练模型输出您应用期望的精确结构。