What is 智能体编程（Agentic Coding）?

由 AI 智能体执行的软件工程，能够规划多文件更改、跨代码库执行更改，并根据测试或构建反馈进行迭代——通过 SWE-Bench Verified 和 SWE-Bench Pro 等基准衡量。

Definition

智能体编程指的是由 AI 智能体在扩展序列上自主执行的软件工程任务。与代码补全（AI 建议接下来几行代码）或基于聊天的辅助（开发者主导）不同，智能体编程接受高级任务描述（“实现功能 X”、“修复模块 Y 中的错误”、“从框架 A 迁移到框架 B”），并产生完成它所需的多文件更改——包括运行测试、观察失败并迭代直至任务成功。

智能体编程的主要测量前沿是 SWE-Bench Verified 和 SWE-Bench Pro，它们基于从开源仓库提取的真实软件工程任务评估模型。2026 年开源权重的 SWE-Bench Verified 领先者是 MiniMax M2.5（约 80.2%），小米的 MiMo V2.5 Pro 据报道在 SWE-Bench Pro 上领先所有可用模型。

Why It Matters

智能体编程已成为 AI 模型最受关注的应用，因为它具有清晰、可衡量的经济价值：一个能自主完成 PR 的编程智能体可节省数小时的工程时间。能力前沿快速推进——SWE-Bench Verified 分数从 2024 年中的 30% 出头升至 2026 年初的 80%+——使智能体编程在越来越多任务范围内可用于生产。