Agent编排框架对比：LangGraph vs AutoGen vs CrewAI

选框架这件事，真的太头疼了。年初我花了整整两周，把主流的Agent编排框架都试了一遍，最后选定了LangGraph。结果上周帮朋友做项目，他用AutoGen，两边一对比，发现差别还挺大的。

这篇文章不是简单的功能对比，而是从实际项目出发，分析每个框架的设计理念、适用场景，以及我踩过的坑。想做Agent项目的同学，看完这篇应该知道怎么选了。

先说结论

维度	LangGraph	AutoGen	CrewAI
学习成本	中	高	低
灵活性	高	高	中
多Agent支持	需自己封装	原生支持	原生支持
状态管理	手动但精细	较弱	中等
生态	LangChain	微软	独立
生产级支持	中	高	低
推荐场景	复杂工作流	企业级应用	快速原型

我的选择建议：

想精细控制工作流 -> LangGraph
想快速出活 -> CrewAI
想企业级稳定性 -> AutoGen

不过这个结论有点太笼统，下面我会详细展开每个框架的特点和适用场景。

LangGraph：灵活度拉满

LangGraph是LangChain团队做的，特点就是极度灵活。它本质上是一个状态机框架，你可以定义任何复杂的节点和边。

核心概念

LangGraph有三个核心概念：State（状态）、Node（节点）、Edge（边）。

python 复制代码

from langgraph.graph import StateGraph, END
from typing import TypedDict
from dataclasses import dataclass

# 定义状态类型
class AgentState(TypedDict):
    messages: list  # 对话历史
    next_action: str  # 下一步动作
    context: dict  # 业务上下文
    metadata: dict  # 元数据

# 创建工作流
workflow = StateGraph(AgentState)

# 添加节点
workflow.add_node("analyze", analyze_node)
workflow.add_node("execute", execute_node)
workflow.add_node("respond", respond_node)

# 添加边
workflow.add_edge("__start__", "analyze")
workflow.add_conditional_edges(
    "analyze",
    should_continue,  # 判断是否继续
    {
        "continue": "execute",
        "end": END
    }
)
workflow.add_edge("execute", "respond")
workflow.add_edge("respond", END)

# 编译
graph = workflow.compile()

状态管理是LangGraph的杀手锏

这是我最想强调的一点。LangGraph的状态是完全可控的：

python 复制代码

from typing import Annotated
from langgraph.graph import add_messages

class CustomState(TypedDict):
    messages: Annotated[list, add_messages]  # 自动追加消息
    current_task: str
    subtasks: list
    results: dict
    execution_history: list  # 完整执行轨迹

def analyze_node(state: CustomState) -> CustomState:
    # 可以访问和修改状态的任何部分
    task = state["current_task"]
    
    # 做复杂的状态转换
    subtasks = decompose_task(task)
    
    return {
        "subtasks": subtasks,
        "execution_history": state["execution_history"] + [{"node": "analyze", "time": time.time()}]
    }

def execute_node(state: CustomState) -> CustomState:
    subtasks = state["subtasks"]
    results = {}
    
    for subtask in subtasks:
        result = execute_subtask(subtask)
        results[subtask.id] = result
    
    return {
        "results": results,
        "execution_history": state["execution_history"] + [{"node": "execute", "time": time.time()}]
    }

这种精细的状态控制在其他框架里很难做到。

条件边：实现动态路由

python 复制代码

def should_continue(state: CustomState) -> str:
    messages = state["messages"]
    last_message = messages[-1]
    
    # 如果需要更多工具调用，继续
    if last_message.tool_calls:
        return "continue"
    
    # 如果是最终响应，结束
    return "end"

workflow.add_conditional_edges(
    "analyze",
    should_continue,
    {
        "continue": "execute",
        "need_more_info": "collect_info",
        "error": "handle_error",
        "end": END
    }
)

检查点和持久化

LangGraph支持检查点，可以从任意状态恢复：

python 复制代码

from langgraph.checkpoint.memory import MemorySaver

# 配置检查点
checkpointer = MemorySaver()

graph = workflow.compile(checkpointer=checkpointer)

# 保存检查点
config = {"configurable": {"thread_id": "user-123"}}
graph.invoke(initial_state, config=config)

# 从检查点恢复
result = graph.get_state(config)

优点总结：

状态完全可控：每个节点可以访问完整状态，可以做任意转换
可以画流程图：用langgraph可视化工具能看到整个流程
生态丰富：LangChain配套的工具、向量库、Prompt库都能直接用
灵活性高：几乎可以实现任何工作流模式

缺点总结：

上手曲线陡：状态管理、工作流设计都要自己写
多Agent要自己封装：官方没有现成的多Agent协作方案
文档分散：很多最佳实践要靠踩坑积累

适合场景：需要精细控制工作流的复杂业务，比如多步骤审批、动态路由、多阶段数据处理、复杂状态机的场景。

AutoGen：微软背书的企业级方案

AutoGen是微软出的，定位是企业级Agent框架。设计上确实考虑了很多生产环境的需求。

核心概念

AutoGen有四个核心概念：AssistantAgent、UserProxyAgent、GroupChat、GroupChatManager。

python 复制代码

from autogen import ConversableAgent, GroupChat, GroupChatManager
from autogen.agentchat import AssistantAgent

# 定义单个Agent
assistant = AssistantAgent(
    name="assistant",
    llm_config={
        "model": "gpt-4",
        "temperature": 0.7,
        "cache": True  # 内置缓存
    },
    system_message="你是一个有帮助的助手，擅长分析和解决问题。"
)

# 用户代理Agent（可以执行代码）
user_proxy = ConversableAgent(
    name="user_proxy",
    llm_config=False,  # 不需要LLM，直接执行
    code_execution_config={"workdir": "coding"}
)

# 多Agent对话
group_chat = GroupChat(
    agents=[assistant, user_proxy, critic],
    messages=[],
    max_round=10,
    speaker_selection_method="round_robot"  # 轮询选择发言
)

manager = GroupChatManager(groupchat=group_chat)

内置的容错机制

AutoGen在生产环境方面做了很多工作：

python 复制代码

from autogen import ConversableAgent

# 重试配置
assistant = AssistantAgent(
    name="assistant",
    llm_config={
        "model": "gpt-4",
        "retry": {
            "max_retries": 3,
            "timeout": 30,
            "backoff_factor": 2
        }
    },
    system_message="..."
)

# 错误处理
assistant.register_reply(
    trigger=None,
    reply_func=error_handler,
    position="end"
)

角色扮演系统

AutoGen原生支持多角色：

python 复制代码

# 定义不同角色的Agent
product_manager = ConversableAgent(
    name="PM",
    system_message="你是产品经理，关注功能价值和用户体验。",
    llm_config={"model": "gpt-4"}
)

tech_reviewer = ConversableAgent(
    name="TechReviewer",
    system_message="你是技术评审，关注技术可行性和风险。",
    llm_config={"model": "gpt-4"}
)

project_manager = ConversableAgent(
    name="PM2",
    system_message="你是项目经理，关注进度和资源。",
    llm_config={"model": "gpt-4"}
)

# 角色扮演对话
group_chat = GroupChat(
    agents=[product_manager, tech_reviewer, project_manager],
    messages=[],
    max_round=15,
    allowed_or_allowed_disallowed_speaker_transitions={
        product_manager: [tech_reviewer, project_manager],
        tech_reviewer: [product_manager, project_manager],
        project_manager: [product_manager, tech_reviewer]
    }
)

与微软生态集成

python 复制代码

# 与Azure AI Studio集成
config_list = [
    {
        "model": "gpt-4",
        "api_key": os.environ["AZURE_OPENAI_API_KEY"],
        "base_url": os.environ["AZURE_OPENAI_ENDPOINT"]
    }
]

# 与Teams集成（需要额外配置）
# 可以把Agent部署为Teams Bot

优点总结：

多Agent原生支持：GroupChat、RolePlay都是内置的
容错机制完善：内置重试、超时、错误处理
微软生态：和Azure、Teams集成方便
生产级特性：缓存、监控、日志都比较完善

缺点总结：

概念太多：Assistant、UserProxy、GroupChatManager...学习成本高
灵活性受限：很多设计固定了，不容易自定义
文档质量一般：很多API写得不清楚
社区活跃度：相比LangGraph，社区要小一些

适合场景：企业内部应用，需要和微软生态集成，对稳定性要求高的场景，或者需要开箱即用的多Agent功能的场景。

CrewAI：快速出活的救星

CrewAI是这三个里最年轻的，但做得很讨巧：让复杂的东西看起来很简单。

核心概念

CrewAI只有三个核心概念：Agent、Task、Crew。

python 复制代码

from crewai import Agent, Task, Crew

# 定义Agent
researcher = Agent(
    role="研究员",
    goal="搜集相关信息，写出高质量的研究报告",
    backstory="""
    你是一个资深研究员，有10年的行业研究经验。
    擅长收集信息、分析趋势、撰写报告。
    """,
    verbose=True
)

writer = Agent(
    role="写手",
    goal="基于研究结果，撰写吸引人的文章",
    backstory="""
    你是一个专业编辑，擅长把复杂的信息转化为易读的文章。
    文笔优美，逻辑清晰。
    """,
    verbose=True
)

# 定义任务
research_task = Task(
    description="研究AI Agent领域的最新发展趋势",
    agent=researcher,
    expected_output="一份详细的研究报告，包含行业趋势、主要玩家、技术演进"
)

write_task = Task(
    description="基于研究报告，撰写一篇面向大众的科普文章",
    agent=writer,
    expected_output="一篇3000字左右的科普文章"
)

# 编排执行
crew = Crew(
    agents=[researcher, writer],
    tasks=[research_task, write_task],
    process="sequential"  # 顺序执行
)

result = crew.kickoff()

任务依赖自动管理

CrewAI会自动处理任务之间的依赖：

python 复制代码

# 如果任务是sequential，后一个任务会自动获取前一个任务的输出
research_task = Task(
    description="研究AI Agent",
    agent=researcher,
    expected_output="研究报告"
)

write_task = Task(
    description="基于研究写文章",
    agent=writer,
    expected_output="文章"
)

# write_task会自动获取research_task的输出

流程模式

python 复制代码

# 顺序执行
crew = Crew(
    agents=[agent1, agent2, agent3],
    tasks=[task1, task2, task3],
    process="sequential"
)

# 层级执行（有一个Manager协调）
crew = Crew(
    agents=[manager, worker1, worker2],
    tasks=[task1, task2],
    process="hierarchical"
)

自定义工具

python 复制代码

from crewai.tools import BaseTool
from pydantic import Field

class SearchTool(BaseTool):
    name: str = "search"
    description: str = "搜索互联网信息"
    
    def _run(self, query: str) -> str:
        # 实现搜索逻辑
        return search_engine(query)

researcher = Agent(
    role="研究员",
    tools=[SearchTool()]  # 绑定工具
)

优点总结：

上手超快：几分钟就能跑起来一个多Agent流程
概念清晰：Agent、Task、Crew三个概念一学就会
任务流程自动管理：依赖关系、结果传递都帮你处理好了
开箱即用：不需要太多配置

缺点总结：

灵活性差：想做一些非标准流程会很麻烦
状态管理弱：复杂状态场景容易出问题
生态还在发展中：集成不如LangChain丰富
生产级特性不够：监控、告警、容错都比较基础

适合场景：快速原型、MVP项目，或者不需要深度定制的简单场景。适合小团队快速验证想法。

横向对比：实操感受

光看概念不够，我说说实际用起来的感受。

开发速度：

CrewAI > AutoGen > LangGraph
我用CrewAI搭一个简单流程只要30分钟，LangGraph要花一下午

调试难度：

LangGraph > AutoGen > CrewAI
LangGraph可以打印完整状态流，出了问题容易定位
AutoGen有内置日志，但不够详细
CrewAI基本没有调试能力

生产稳定性：

AutoGen > LangGraph > CrewAI
AutoGen在微软内部生产环境跑过，稳定性有保证
LangGraph需要自己添加很多保护措施
CrewAI在生产环境中出现过一些奇怪的问题

代码量对比（实现同样的多Agent协作功能）：

python 复制代码

# CrewAI
crew = Crew(agents=[a, b], tasks=[t1, t2])
result = crew.kickoff()

# LangGraph（需要自己封装多Agent）
workflow = StateGraph(MultiAgentState)
workflow.add_node("agent_a", agent_a_node)
workflow.add_node("agent_b", agent_b_node)
workflow.add_edge("__start__", "agent_a")
workflow.add_edge("agent_a", "agent_b")

# AutoGen（相对冗长）
group_chat = GroupChat(agents=[a, b], max_round=10)
manager = GroupChatManager(groupchat=group_chat)

一个真实的选型案例

年初我做的一个数据分析平台，最初用CrewAI快速搭了一个MVP，用了一周时间就做出了能跑的东西。

后来业务变复杂了，需要：

多步骤的数据清洗和转换
动态判断下一步做什么
支持回滚和重试
详细的执行日志

CrewAI扛不住了，重写用LangGraph，又花了两周。

如果一开始就用LangGraph，可能总共只要两周半，但用CrewAI快速验证想法的那一周也很值。

所以我的建议是：先用CrewAI快速验证想法，确定要做深再用LangGraph重写。

迁移成本

如果你做到一半想换框架，迁移成本也要考虑：

迁移方向	成本	说明
CrewAI -> LangGraph	中等	需要重写流程编排逻辑，Agent逻辑可以保留
LangGraph -> AutoGen	高	概念差异大，几乎重写
AutoGen -> CrewAI	低	两边概念比较像，转换相对容易
LangGraph -> CrewAI	中等	重写流程，Agent可以复用
AutoGen -> LangGraph	高	需要重新设计状态管理

常见问题

Q：LangGraph和LangChain是什么关系？

A：LangGraph是LangChain的子项目，可以独立使用。LangGraph更适合做复杂工作流，LangChain更适合做简单的LLM调用。

Q：AutoGen和LangGraph可以一起用吗？

A：可以，但没必要。两个框架理念不同，混用会增加复杂度。

Q：CrewAI能用于生产吗？

A：目前版本更适合原型和中小规模项目。生产级应用建议LangGraph或AutoGen。

Q：三个框架支持哪些LLM？

LangGraph：OpenAI、Anthropic、Google等（通过LangChain）
AutoGen：OpenAI、Azure OpenAI、兼容OpenAI API的模型
CrewAI：OpenAI、Anthropic等主流模型

写在最后

选框架不要看它有多少酷炫功能，要看适不适合你的场景。

我的建议是：

验证想法阶段：用CrewAI，一小时搭建原型
复杂业务场景：用LangGraph，完全掌控工作流
企业级应用：用AutoGen，省心省力

就像买衣服，先试穿，确定合适再裁剪。框架选对了，事儿就成了一半。