Back to blog
    CrewAI 微调模型:无 API 费用的多智能体工作流
    crewaiagentsfine-tuningmulti-agentcost-reductionsegment:developer

    CrewAI 微调模型:无 API 费用的多智能体工作流

    一个有 4 个智能体、每个任务 20+ 次 LLM 调用的 CrewAI 工作流在 GPT-4 上每次执行可能花费 2-5 美元。微调本地模型让多智能体工作流在经济上可行。

    EErtas Team·

    CrewAI 让多智能体工作流变得易于使用。定义有角色的智能体,给它们工具,组成 crew,让它们协作完成复杂任务。

    问题是"四个智能体协作「意味着」四个智能体各自进行 5-10 次 LLM 调用"。单次 crew 执行在 GPT-4o 上可能达到 20-40 次 API 调用。每天运行 100 次——一个适度的生产工作负载——您就花费 200-500 美元/天,即 6,000-15,000 美元/月。

    多智能体架构有成本乘数问题。微调本地模型是让多智能体工作流在规模上经济可持续的唯一方式。

    哪些 CrewAI 角色适合微调模型

    适合微调 7-8B 模型的角色

    • **研究/采集智能体:**查询生成和摘要
    • **写作/生成智能体:**领域特定内容生成
    • **分析/分类智能体:**评估、评分或分类
    • **格式化/后处理智能体:**结构化输出转换

    仍需前沿模型的角色

    • **战略规划智能体:**需要为新问题创建多步计划
    • **复杂推理智能体:**需要评估多个矛盾数据点
    • **对抗审查智能体:**需要发现缺陷和质疑假设

    为不同智能体分配不同模型

    from crewai import Agent, Crew, Task
    from langchain_ollama import ChatOllama
    from langchain_openai import ChatOpenAI
    
    researcher_llm = ChatOllama(model="ft-researcher-8b")
    writer_llm = ChatOllama(model="ft-writer-8b")
    editor_llm = ChatOllama(model="ft-editor-8b")
    strategist_llm = ChatOpenAI(model="gpt-4o")

    费用对比:三种配置

    以四智能体内容 crew 每天 500 个任务为例:

    配置月费用
    全部 GPT-4o$5,625/月
    混合 Crew(3 本地 + 1 GPT-4o)$3,112/月(降低 45%)
    全部本地(仅 GPT-4o 降级)$581/月(降低 90%)

    从 $5,625/月降到 $581/月,年省 $60,528。

    何时多智能体过度

    如果智能体只是做顺序处理,单个模型用结构化提示可以用 3 次调用完成相同的事——而不是 15 次。先简化,再微调。


    Ship AI that runs on your users' devices.

    Ertas early bird pricing starts at $14.50/mo — locked in for life. Plans for builders and agencies.

    延伸阅读

    Ship AI that runs on your users' devices.

    Early bird pricing starts at $14.50/mo — locked in for life. Plans for builders and agencies.

    Keep reading