AutoGen + Ertas
使用 Ertas 训练的模型作为专业智能体大脑,通过 AutoGen 构建多智能体系统,实现协作式问题解决和复杂任务自动化。
Overview
AutoGen 是由 Microsoft Research 开发的开源多智能体框架,能够构建由多个 AI 智能体通过对话协作解决复杂任务的应用。AutoGen 不是让单个 LLM 处理所有事情,而是编排专业智能体之间的对话——规划智能体分解任务、编码智能体编写解决方案、评审智能体审查输出、用户代理智能体处理人在回路的交互。这种分工模式模拟了人类团队的工作方式,在复杂的多步骤问题上产生显著更好的结果。
AutoGen 的对话驱动架构 支持完全自主的智能体团队和人工监督的工作流,智能体在执行关键操作前请求批准。该框架自动处理消息路由、对话状态管理、终止条件和错误恢复。智能体可以使用工具、在沙盒环境中执行代码并访问外部数据源。对于构建超越单一提示交互的复杂 AI 工作流的企业团队,AutoGen 提供了将多个专业模型协调成连贯问题解决管道的编排层。
How Ertas Integrates
Ertas 训练的模型通过为每个智能体配置不同的微调模型来与 AutoGen 集成,每个模型针对其特定角色进行了优化。在 Ertas Studio 中训练多个专业模型后——一个用于规划、一个用于领域分析、一个用于代码生成、一个用于质量审查——您将每个模型分配给相应的 AutoGen 智能体。这创建了一个多智能体系统,其中每个智能体都是其特定功能的专家,而不是依赖单一通用模型来承担所有角色。
对智能体系统性能的影响是显著的。充当代码审查智能体的通用模型可能会遗漏领域特定的反模式,但在您代码库的审查历史上微调的模型恰好能捕捉您团队关注的模式。在您组织的任务分解模式上训练的规划智能体比通用模型猜测您的工作流程生成更好的工作分解结构。Ertas 使训练这些专业模型变得切实可行,因为 LoRA 适配器体积小、训练高效——您可以维护一个共享同一基础模型的角色专用适配器库,部署到同一推理服务器,使用 Ollama 或 vLLM。
Getting Started
- 1
确定智能体角色并微调专业模型
规划您的多智能体工作流并确定专业角色。在 Ertas Studio 中使用角色特定的训练数据为每个角色微调一个单独的模型。
- 2
将模型部署到推理端点
通过 Ollama(支持同时服务多个模型)或部署单独的 vLLM 实例以获得更高吞吐量来提供每个微调模型的服务。
- 3
配置带有模型分配的 AutoGen 智能体
创建 AutoGen 智能体并通过兼容 OpenAI 的 API 配置为每个智能体分配其专用的 Ertas 训练模型。
- 4
定义对话流程和终止条件
设置多智能体对话拓扑——哪些智能体相互交谈、任务如何委派以及对话何时终止。
- 5
运行并优化智能体团队
执行多智能体工作流并分析对话日志。确定哪些智能体需要更好的训练数据,并在 Ertas Studio 中重新训练以持续改进。
from autogen import AssistantAgent, UserProxyAgent
# Configure different Ertas-trained models for each agent role
planner_config = {
"config_list": [{
"model": "ertas-planner-7b",
"base_url": "http://localhost:11434/v1",
"api_key": "not-needed",
}]
}
analyst_config = {
"config_list": [{
"model": "ertas-legal-analyst-7b",
"base_url": "http://localhost:11434/v1",
"api_key": "not-needed",
}]
}
# Create specialized agents
planner = AssistantAgent(
name="Planner",
system_message="Break down complex legal research tasks into steps.",
llm_config=planner_config,
)
analyst = AssistantAgent(
name="LegalAnalyst",
system_message="Analyze legal documents and extract key findings.",
llm_config=analyst_config,
)
user_proxy = UserProxyAgent(name="User", human_input_mode="TERMINATE")
# Start a multi-agent conversation
user_proxy.initiate_chat(
planner,
message="Analyze the merger agreement for antitrust risks.",
)Benefits
- 为每个智能体角色分配专门的微调模型以获得最大专业性
- 多智能体协作产生比单模型方法更好的结果
- LoRA 适配器使多个专业模型在共享基础设施上保持高效
- 人在回路控制,支持受监督的自主工作流
- 在沙盒环境中执行代码,确保安全自动化
- 对话日志为迭代模型改进提供丰富的训练数据
Related Resources
Fine-Tuning
GGUF
Inference
LoRA
Getting Started with Ertas: Fine-Tune and Deploy Custom AI Models
How to Fine-Tune an LLM: The Complete 2026 Guide
Fine-Tune AI Models Without Writing Code
Privacy-Conscious AI Development: Fine-Tune in the Cloud, Run on Your Terms
Running AI Models Locally: The Complete Guide to Local LLM Inference
CrewAI
LangChain
Ollama
SuperAgent
vLLM
Ertas for Legal
Ertas for Code Generation
Ertas for Data Extraction
Ertas for AI Automation Agencies
Ship AI that runs on your users' devices.
Early bird pricing starts at $14.50/mo — locked in for life. Plans for builders and agencies.