本文较长,建议点赞收藏。更多AI大模型应用开发学习视频及资料,在智泊AI。
由于本章节内容较多,将会拆分成两篇文章进行讲解。第一篇是理论篇,主要介绍Agentic框架机器对比、核心概念和原理;第二篇是实战篇,将通过实际案例演示如何使用LangGraph构建聊天机器人,并探讨其在实际应用中的优势。
本篇为理论篇。
1. 引言
Agentic框架通过使自主系统能够动态感知、推理和行动,彻底改变了AI领域。本节将探讨Agentic框架的核心概念,并阐述开源解决方案对现代AI开发创新和扩展的重要性。
1.1 什么是Agentic框架?
Agentic框架代表了人工智能系统设计范式的转变。与依赖静态预定义工作流的传统AI应用不同,Agentic框架引入了能够自主感知、推理和行动的动态自适应系统。这些框架将复杂任务分解为可由专业agent协作完成的子任务,通过利用大语言模型(LLMs)管理流程、做出决策并无缝集成工具,使其成为动态决策和实时问题解决等高级应用的理想选择。
关键参考:
LangGraph和CrewAI等框架体现了这种动态方法,使开发者能够突破单agent线性工作流的限制,构建多agent协作系统。
1.2 为何它们如此重要?
从头构建agent极具挑战性。LangGraph、CrewAI和OpenAI Swarm等框架简化了这一过程,使开发者可以专注于应用逻辑,而无需重新设计状态管理、编排和工具集成等基础架构。
Agent框架的核心价值:
- 定义agent和工具的简便方式
- 编排机制
- 状态管理
- 支持复杂应用的附加工具(如持久层、中断处理等)
后续章节将逐一解析这些核心要素
- 主流Agentic框架与库
来源:analyticsvidhya
2.1 Langchain
LangChain 作为强大而灵活的框架,极大简化了基于大语言模型(LLMs)应用的开发。通过丰富的工具集和抽象层,开发者可以构建具备复杂推理、任务执行和外部数据/API交互能力的AI agent。
该框架解决了长对话上下文保持、外部信息整合和多步骤项目协调等核心挑战。其模块化架构支持灵活组合各种组件,适用于多种应用场景。
- GitHub链接: *** LangChain GitHub***
- 文档链接: *** python.langchain.com/docs/introd...***
2.2 LangGraph
LangGraph 是LangChain的扩展,支持使用大语言模型构建有状态的多参与者应用,特别适用于需要规划、反思和多agent协调的复杂交互式AI系统。
- GitHub链接: *** LangGraph***
- 文档链接: *** LangGraph***
2.3 CrewAI
CrewAI 是角色扮演AI agent编排框架,允许开发者创建具有特定职责的AI"团队"来协作处理复杂任务,特别适用于需要多领域专业知识的协同系统。
- GitHub链接: *** CrewAI GitHub***
- 文档: *** CrewAI***
2.4 Microsoft Semantic Kernel
Microsoft Semantic Kernel 旨在弥合传统软件开发与AI能力之间的鸿沟。它特别专注于将大型语言模型(LLMs)集成到现有应用中。该框架为开发者提供了在不完全重构现有代码库的情况下整合AI功能的工具。
该SDK的轻量级特性和对多编程语言的支持使其能高度适应各种开发环境。其编排器允许管理复杂的多步骤AI任务,使开发者能够在应用中创建复杂的AI驱动工作流。
- GitHub 链接: *** Microsoft Semantic Kernal***
- 文档链接: *** Microsoft Semantics Kernel***
2.5 Microsoft AutoGen
Microsoft AutoGen 是一个用于构建高级AI Agent 和多 Agent 系统的开源框架。由微软研究院开发,AutoGen为创建对话式和任务完成型AI应用提供了灵活而强大的工具包。它强调模块化、可扩展性和易用性,使开发者能够高效构建复杂的AI系统。
- 文档: *** microsoft.github.io/autogen/sta...***
- GitHub 链接: *** Microsoft Autogen***
2.6 Smolagents
Smolagents是一个尖端的开源框架,旨在彻底改变AI Agent 的开发。它为开发者提供了构建智能协作多 Agent 系统的全面工具包。该框架注重灵活性和模块化,支持创建可以独立运行或在人类监督下协作的复杂AI系统。
- 文档: *** huggingface.co/docs/smolag...***
- GitHub 链接: *** github.com/huggingface...***
2.7 AutoGPT
AutoGPT 基于强大的GPT-4语言模型,可以通过语言输入执行目标导向活动,代表了自主AI Agent 领域的重大进步。这个尖端AI助手将决策能力提升到新高度,超越了基本反射代理,整合了使其在各种应用中成为无价工具的复杂功能。
- 文档: *** huggingface.co/docs/smolag...***
- GitHub 链接: *** github.com/huggingface...***
2.8 Agno (Phidata)
我们将讨论的最后一个AI Agent框架是 Phidata。这是一个多模态 Agent 框架,可以开发执行协作的 Agent 系统。它也被设计为与内存和工具等组件协同工作,帮助 Agent 实现自主和一致的操作。
默认情况下,Phidata Agent 支持文本、图像和音频等多模态数据,这使得它们无需依赖外部工具即可发挥价值。该框架还提供Agentic UI,方便用户与 Agent 进行可视化交互。它们也是率先实现Agentic RAG(Agent 可以搜索知识库)的框架之一。
- 文档: *** docs.phidata.com/introductio...***
- GitHub 链接: *** github.com/agno-agi/ph...***
3. AI代理框架对比
以下图表对本文讨论的关键AI Agent 框架进行了高层次对比。此对比旨在突出每个框架的独特优势和重点领域,帮助开发者和研究人员根据具体需求选择最合适的工具。

图片清晰度较差,下表也从一些核心维度对各框架做个对比:
| 框架 | 核心优势 | 适用场景 | 学习曲线 | 社区活跃度 |
|---|---|---|---|---|
| LangGraph | 可视化工作流编排 | 复杂状态管理应用 | 中等 | ★★★★☆ |
| CrewAI | 角色驱动协作 | 多专家系统构建 | 低 | ★★★☆☆ |
| Semantic Kernel | 传统系统集成 | 企业级应用改造 | 高 | ★★★★☆ |
| AutoGen | 对话系统专业化 | 客服/虚拟助手开发 | 中等 | ★★★★☆ |
| Smolagents | 轻量级快速原型 | 初创项目/PoC验证 | 低 | ★★☆☆☆ |
4. 深入探究LangGraph
LangGraph是由LangChain团队构建的库,旨在帮助开发者创建基于图的单 Agent 或多 Agent AI应用。作为一个底层框架,LangGraph允许开发者控制 Agent 间的交互方式、工具选择以及应用内的信息流。
4.1 什么是图(Graph)?
想象你有一组数据,可以用一个网络表示,其中每个数据或实体与其他数据或实体存在多种类型的关系(一对一、一对多、多对多等)。图由两个主要组件构成:节点(Nodes) 和边(Edges) 。
图的两种类型:
-
有向图
边具有方向性,表示节点间的流向或关系(例如社交媒体上的关注关系)。
-
无向图
边无方向性,表示对称关系(例如LinkedIn上的连接关系)。

4.2 核心概念
4.2.1 图结构
LangGraph的设计核心是应用工作流的图表示。该图包含两个主要元素:
-
节点
工作的构建模块:每个节点代表应用中的一个独立工作单元或操作。这些节点本质上是封装特定任务的Python函数,例如:
- 直接与LLM交互以生成文本或摘要。
- 调用外部工具或API获取数据。
- 数据格式化、过滤或转换。
- 与用户交互获取输入或显示信息。
-
边
引导信息流和控制流:边作为连接图的纽带,建立信息流动路径和操作顺序。LangGraph支持多种边类型:
-
简单边
表示节点间的直接无条件流动,前一个节点的输出作为后一个节点的输入,形成线性流程。
-
条件边
基于特定节点操作结果动态分支流程。例如根据用户响应决定终止交互或调用工具。

4.2.2 状态管理
LangGraph通过自动状态管理确保多 Agent 系统共享对任务当前状态的统一理解。该库自动跟踪和更新中央状态对象,状态对象存储关键信息,例如:
-
对话历史
聊天应用中存储用户与机器人的对话上下文。
-
上下文数据
用户偏好、历史行为或相关外部数据。
-
内部变量
Agent 使用的内部标志、计数器等。
学习资源推荐
如果你想更深入地学习大模型,以下是一些非常有价值的学习资源,这些资源将帮助你从不同角度学习大模型,提升你的实践能力。
本文较长,建议点赞收藏。更多AI大模型应用开发学习视频及资料,在智泊AI。