12 节课解锁 AI Agents，让AI替你打工（三）：框架之理论篇

本文较长，建议点赞收藏。更多AI大模型应用开发学习视频及资料，在智泊AI。
由于本章节内容较多，将会拆分成两篇文章进行讲解。第一篇是理论篇，主要介绍Agentic框架机器对比、核心概念和原理；第二篇是实战篇，将通过实际案例演示如何使用LangGraph构建聊天机器人，并探讨其在实际应用中的优势。

本篇为理论篇。

1. 引言

Agentic框架通过使自主系统能够动态感知、推理和行动，彻底改变了AI领域。本节将探讨Agentic框架的核心概念，并阐述开源解决方案对现代AI开发创新和扩展的重要性。

1.1 什么是Agentic框架？

Agentic框架代表了人工智能系统设计范式的转变。与依赖静态预定义工作流的传统AI应用不同，Agentic框架引入了能够自主感知、推理和行动的动态自适应系统。这些框架将复杂任务分解为可由专业agent协作完成的子任务，通过利用大语言模型（LLMs）管理流程、做出决策并无缝集成工具，使其成为动态决策和实时问题解决等高级应用的理想选择。

关键参考：

LangGraph和CrewAI等框架体现了这种动态方法，使开发者能够突破单agent线性工作流的限制，构建多agent协作系统。

1.2 为何它们如此重要？

从头构建agent极具挑战性。LangGraph、CrewAI和OpenAI Swarm等框架简化了这一过程，使开发者可以专注于应用逻辑，而无需重新设计状态管理、编排和工具集成等基础架构。

Agent框架的核心价值：

定义agent和工具的简便方式
编排机制
状态管理
支持复杂应用的附加工具（如持久层、中断处理等）

后续章节将逐一解析这些核心要素

主流Agentic框架与库

来源：analyticsvidhya

2.1 Langchain

LangChain 作为强大而灵活的框架，极大简化了基于大语言模型（LLMs）应用的开发。通过丰富的工具集和抽象层，开发者可以构建具备复杂推理、任务执行和外部数据/API交互能力的AI agent。

该框架解决了长对话上下文保持、外部信息整合和多步骤项目协调等核心挑战。其模块化架构支持灵活组合各种组件，适用于多种应用场景。

GitHub链接： *** LangChain GitHub***
文档链接： *** python.langchain.com/docs/introd...***

2.2 LangGraph

LangGraph 是LangChain的扩展，支持使用大语言模型构建有状态的多参与者应用，特别适用于需要规划、反思和多agent协调的复杂交互式AI系统。

GitHub链接： *** LangGraph***
文档链接： *** LangGraph***

2.3 CrewAI

CrewAI 是角色扮演AI agent编排框架，允许开发者创建具有特定职责的AI"团队"来协作处理复杂任务，特别适用于需要多领域专业知识的协同系统。

GitHub链接： *** CrewAI GitHub***
文档： *** CrewAI***

2.4 Microsoft Semantic Kernel

Microsoft Semantic Kernel 旨在弥合传统软件开发与AI能力之间的鸿沟。它特别专注于将大型语言模型（LLMs）集成到现有应用中。该框架为开发者提供了在不完全重构现有代码库的情况下整合AI功能的工具。

该SDK的轻量级特性和对多编程语言的支持使其能高度适应各种开发环境。其编排器允许管理复杂的多步骤AI任务，使开发者能够在应用中创建复杂的AI驱动工作流。

GitHub 链接: *** Microsoft Semantic Kernal***
文档链接: *** Microsoft Semantics Kernel***

2.5 Microsoft AutoGen

Microsoft AutoGen 是一个用于构建高级AI Agent 和多 Agent 系统的开源框架。由微软研究院开发，AutoGen为创建对话式和任务完成型AI应用提供了灵活而强大的工具包。它强调模块化、可扩展性和易用性，使开发者能够高效构建复杂的AI系统。

文档: *** microsoft.github.io/autogen/sta...***
GitHub 链接: *** Microsoft Autogen***

2.6 Smolagents

Smolagents是一个尖端的开源框架，旨在彻底改变AI Agent 的开发。它为开发者提供了构建智能协作多 Agent 系统的全面工具包。该框架注重灵活性和模块化，支持创建可以独立运行或在人类监督下协作的复杂AI系统。

文档: *** huggingface.co/docs/smolag...***
GitHub 链接: *** github.com/huggingface...***

2.7 AutoGPT

AutoGPT 基于强大的GPT-4语言模型，可以通过语言输入执行目标导向活动，代表了自主AI Agent 领域的重大进步。这个尖端AI助手将决策能力提升到新高度，超越了基本反射代理，整合了使其在各种应用中成为无价工具的复杂功能。

文档: *** huggingface.co/docs/smolag...***
GitHub 链接: *** github.com/huggingface...***

2.8 Agno (Phidata)

我们将讨论的最后一个AI Agent框架是 Phidata。这是一个多模态 Agent 框架，可以开发执行协作的 Agent 系统。它也被设计为与内存和工具等组件协同工作，帮助 Agent 实现自主和一致的操作。

默认情况下，Phidata Agent 支持文本、图像和音频等多模态数据，这使得它们无需依赖外部工具即可发挥价值。该框架还提供Agentic UI，方便用户与 Agent 进行可视化交互。它们也是率先实现Agentic RAG（Agent 可以搜索知识库）的框架之一。

文档: *** docs.phidata.com/introductio...***
GitHub 链接: *** github.com/agno-agi/ph...***

3. AI代理框架对比

以下图表对本文讨论的关键AI Agent 框架进行了高层次对比。此对比旨在突出每个框架的独特优势和重点领域，帮助开发者和研究人员根据具体需求选择最合适的工具。

图片清晰度较差，下表也从一些核心维度对各框架做个对比：

框架	核心优势	适用场景	学习曲线	社区活跃度
LangGraph	可视化工作流编排	复杂状态管理应用	中等	★★★★☆
CrewAI	角色驱动协作	多专家系统构建	低	★★★☆☆
Semantic Kernel	传统系统集成	企业级应用改造	高	★★★★☆
AutoGen	对话系统专业化	客服/虚拟助手开发	中等	★★★★☆
Smolagents	轻量级快速原型	初创项目/PoC验证	低	★★☆☆☆

4. 深入探究LangGraph

LangGraph是由LangChain团队构建的库，旨在帮助开发者创建基于图的单 Agent 或多 Agent AI应用。作为一个底层框架，LangGraph允许开发者控制 Agent 间的交互方式、工具选择以及应用内的信息流。

4.1 什么是图（Graph）？

想象你有一组数据，可以用一个网络表示，其中每个数据或实体与其他数据或实体存在多种类型的关系（一对一、一对多、多对多等）。图由两个主要组件构成：节点（Nodes） 和边（Edges） 。

图的两种类型：

有向图

边具有方向性，表示节点间的流向或关系（例如社交媒体上的关注关系）。
无向图

边无方向性，表示对称关系（例如LinkedIn上的连接关系）。

4.2 核心概念

4.2.1 图结构

LangGraph的设计核心是应用工作流的图表示。该图包含两个主要元素：

节点

工作的构建模块：每个节点代表应用中的一个独立工作单元或操作。这些节点本质上是封装特定任务的Python函数，例如：

直接与LLM交互以生成文本或摘要。
调用外部工具或API获取数据。
数据格式化、过滤或转换。
与用户交互获取输入或显示信息。

边

引导信息流和控制流：边作为连接图的纽带，建立信息流动路径和操作顺序。LangGraph支持多种边类型：

简单边

表示节点间的直接无条件流动，前一个节点的输出作为后一个节点的输入，形成线性流程。
条件边

基于特定节点操作结果动态分支流程。例如根据用户响应决定终止交互或调用工具。

4.2.2 状态管理

LangGraph通过自动状态管理确保多 Agent 系统共享对任务当前状态的统一理解。该库自动跟踪和更新中央状态对象，状态对象存储关键信息，例如：

对话历史

聊天应用中存储用户与机器人的对话上下文。
上下文数据

用户偏好、历史行为或相关外部数据。
内部变量

Agent 使用的内部标志、计数器等。

学习资源推荐

如果你想更深入地学习大模型，以下是一些非常有价值的学习资源，这些资源将帮助你从不同角度学习大模型，提升你的实践能力。

本文较长，建议点赞收藏。更多AI大模型应用开发学习视频及资料，在智泊AI。