AI智能体详细介绍（二）-LangChain 生态

一、智能体时代与 LangChain 生态

1.1 智能体的崛起与应用趋势

2022 年年底，大模型 ChatGPT 3.5 横空出世，将人工智能时代清晰地划分为前后两个时期。大模型的出现，展现出一种前所未有的通用智能：它不仅能解析人类语言的复杂意图，还能进行跨领域的知识融合与推理，生成连贯且富有洞见的解决方案。这标志着，我们终于拥有了一个可被广泛调用的数字大脑。

当大模型被赋予感知环境、制订计划并执行任务的能力时 ，一种全新的软件范式便应运而生 ------ 这就是智能体。它不再是遵循预设流程的被动工具，而是能够主动理解目标、规划路径并采取行动的数字化行动者。智能体正以其高度的自主性和适应性，重塑软件的定义，并开始在一些领域替代传统的应用模式与 SaaS 服务。

1.1.1 从传统应用到智能体时代

技术演进的轨迹清晰地勾勒出从 PC 互联网时代、移动互联网时代到 AI 智能化时代的技术演进浪潮。期间虽不乏区块链、元宇宙等热点技术，但真正引发范式革命的，始终是核心交互模式的根本性重塑。如图 1-1 所示，我们正处在这样一个历史性的转折点上。

图 1-1 从传统应用到智能体的演进，其本质是一场从命令执行到目标协作的深刻变革。

传统应用：确定性的逻辑闭环

传统应用构建于确定性逻辑基石之上。用户通过页面输入指令，传统应用依据预设的规则与流程执行操作，最终输出确定的结果。这种模式的优势在于稳定、可控与可预测，但其边界也很清晰。

（1）交互僵化：系统能识别格式化指令，却无法理解语言背后的真实意图。

（2）功能固化：能力范围在开发阶段即被限定，难以应对边界外的需求。

（3）行为静态：无法感知环境变化，缺乏动态调整与自我优化的能力。

智能体：系统首次理解目标

大模型的出现，为软件注入了理解与思考的能力。大模型赋予了软件解析自然语言、推断用户意图并进行多步规划的核心潜能。在此基础上，智能体作为一种新的应用范式登上了历史舞台。与传统应用相比，智能体接收的不再是具体指令，而是一个高层次的目标。它能够自主拆解目标、规划步骤、调用工具，并在执行过程中根据反馈灵活调整。

必须承认，当前的智能体技术仍处于早期阶段，多数应用仍依赖于预定义的工作流来保证稳定性。随着大模型能力的提升与技术生态的成熟，智能体的自主性与适应性正在持续增强。未来几年内，智能体有望在更多业务场景中发挥更重要的作用。

范式转移：从线性执行到感知、决策闭环

传统应用与智能体的区别，远不止技术实现，更体现在思维方式上，具体对比如表 1-1 所示。

|----------|-----------|-----------|
| 对比维度 | 传统应用 | 智能体 |
| 驱动模式 | 命令驱动 | 目标驱动 |
| 交互方式 | 固定界面、参数输入 | 自然语言、语义理解 |
| 执行逻辑 | 流程化、预定义 | 自主规划、多步推理 |
| 学习机制 | 静态算法 | 动态学习与记忆 |
| 系统角色 | 工具 | 合作伙伴 |

传统应用遵循 "输入 --- 处理 --- 输出" 的线性逻辑，而智能体则运行在 "感知 --- 决策 --- 行动 --- 记忆" 的持续循环中。智能体不仅能行动，还能从结果中学习，并动态优化后续策略。

开发范式的重构

对于开发者而言，智能体时代要求我们从功能实现的思维转向行为建模的思维。对于企业而言，数字化系统不再仅是流程自动化的工具，而是能够参与协作、自主决策并持续进化的数字员工。这种范式转移将带来以下三大趋势。

（1）用户页面消融化：复杂的图形页面不再是必需的，自然语言成为最主要的交互方式。

（2）应用形态模块化：业务能力由多个专业智能体承载，它们可被灵活组装，形成动态的工作流。

（3）开发逻辑目标化：开发者的核心任务从编写确定性的业务逻辑转变为确保智能体能准确理解并高效完成人类设定的目标。

从传统应用到智能体的演进，不仅是技术的升级，而且是一次人机关系的重新定义。过去，我们是命令者，传统应用是服从者；未来，我们是目标的提出者，智能体是实现目标的合作伙伴。随着相关技术不断成熟，它们将主动承担起规划、协调与执行的重任，成为人类认知与行动能力的延伸。

1.1.2 智能体的核心概念

在 1.1.1 节中，我们了解了智能体与传统应用的根本区别：智能体能够理解目标、规划路径并自主行动。如果说传统应用是服从命令的士兵，那么智能体则更接近于一位能够独立思考、判断并持续学习的专业助手。

要深入理解智能体的本质，我们就需要系统拆解其四大核心能力模块：感知（Perception）、决策（Reasoning）、行动（Action）、记忆（Memory）。这四大模块共同构成了智能体赖以运作的认知闭环，其基本构成可参考图 1-2 所示。

1. 感知：从接收指令到理解意图

感知是智能体与世界交互的起点。在传统应用中，输入是格式化的、明确的。例如，一个结构化的 API 调用或一次精准的按钮点击。

在智能体范式下，输入是模糊的、自然的、充满上下文依赖的。例如，用户可能直接提出：帮我找出上周销售数据异常的原因。在这个请求中并未指明具体的数据表、分析维度或异常判定标准。智能体的首要任务就是准确理解这个模糊意图背后的真实目标。

这一重任主要由大模型承担。它通过强大的语义解析与上下文理解能力，将人类的自然语言、图像等多模态信息，转化为清晰、机器可处理的意图表示。所以，感知能力的核心价值在于：让机器听懂人话，读懂世界。这好比人类的感官系统，决定了智能体认知世界的广度与深度。

2. 决策：从执行逻辑到自主规划

感知让智能体理解了要解决什么问题 ，而决策则聚焦如何解决这个问题。在此阶段，智能体需要完成两项关键任务。

（1）目标明确化：将模糊的用户意图转化为清晰、可衡量的具体目标。

（2）路径规划：制定出一系列可执行的步骤以实现该目标。

以 "准备季度市场分析简报" 为例，一个具备决策能力的智能体可能会自动生成以下计划。检索最新的行业报告→整合内部销售数据→分析竞品动态→提炼核心趋势与风险→生成结构化简报。

此过程远不止文本生成，其内核是复杂的推理与规划，这背后通常依赖两类关键技术。

（1）链式思考（Chain-of-Thought，CoT）：通过显式推理路径提高逻辑一致性。

（2）任务规划器（Planner）：将复杂目标拆解为可执行的子任务。

所以，决策模块是智能体的大脑，直接决定了其智能水平的高低，是区分简单自动化与真正智能的关键。总结：感知赋予智能体理解力，决策则赋予其思考力。

3. 行动：从思考到执行

智能体之所以能重塑软件范式，核心在于其拥有将思考转化为现实的行动能力。

行动模块的核心职责是将决策结果转化为实际的价值输出。典型行动如下：

（1）调用外部工具与 API（如查询数据库、调用检索引擎、访问 CRM 系统）。

（2）操作应用（如操作 Excel 生成图表、通过邮件系统发送报告）。

（3）执行特定命令或触发业务流程（如发起流程、创建文档、生成报告）。

例如，当用户指令是将客户反馈汇总后发送给产品团队时，一个成熟的智能体不止步于生成摘要文本，而是会自动连接客服系统拉取原始反馈数据，执行分析与主题归纳任务，调用内部通信工具，将结构化报告发送给指定团队。

所以，行动模块让智能体真正具备了改造现实世界的能力。总结：感知决定方向，决策规划路径，行动则实现最终价值。

4 记忆：从单次对话到持续进化

记忆是智能体实现持续智能的基石。没有记忆的智能体，每次交互都是孤立的。它可能反应迅速，但无法积累经验，无法建立关联，更无法实现成长。记忆模块赋予了时间的维度，使其能够保存对话历史、任务上下文、执行结果与用户偏好，形成短期记忆和长期记忆。

（1）短期记忆：在当前对话或任务中保留上下文信息。

（2）长期记忆：跨任务、跨时间存储经验与知识，用于持续优化行为。

在技术实现上，记忆通常使用向量数据库或知识库等方式完成。这使得智能体能够记住用户习惯，并借鉴过去的成功经验。

例如，个人助理智能体在多次为用户安排差旅后，会逐渐记住其偏好的航空公司、酒店品牌和出行时间，从而在未来提供愈发精准和个性化的服务。总结：记忆让智能体从一次性工具转变为可以共同成长的伙伴。

5 闭环：智能体间的协同

当感知、决策、行动与记忆这四个模块循环运作时，便构成了智能体完整的认知循环，如图 1-3 所示。

其运行流程可以概括为：用户输入→感知（理解目标）→决策（规划路径）→行动（执行任务）→记忆（记录经验）→再次感知（优化与学习）。

图 1-3：用户输入→感知 (理解目标)→决策 (规划路径)→行动 (执行任务)→记忆 (记录经验)→再次感知 (优化与学习)

在这个闭环中，每一次循环都是一次优化与学习的机会。智能体通过记忆积累的经验反过来会提高其感知敏锐度、决策质量和行动效率。我们可以这样比喻： 感知是眼睛，决策是大脑，行动是双手，记忆是灵魂。正是这四者精密协同，使得智能体超越了传统工具范畴，进化为一个具备环境适应性、目标驱动性与持续进化能力的数字生命体。

1.2 LangChain 生态体系概览

在 1.1 节中，我们系统理解了智能体的核心概念与运行机制。当我们要从理论走向实践时，一个关键问题随之浮现：如何将这一全新的智能范式项目化为稳定、可靠的应用？

回顾软件发展的历程，其形态大致经历了三个主要阶段：从早期的功能驱动，到移动互联网时代的数据驱动，再到如今由大模型引领的智能驱动。每一次范式更迭的核心都是我们对效率与价值的重新定义。

在当前这场以智能为核心的变革中，智能体正迅速成为新一代应用的核心形态。它的出现，并无意在 "取代" 所有传统应用，而是作为一种更高级的抽象，在特定场景下成为主导，在更广泛的领域内，则与传统应用相互融合、协同共生，构建起更加智能的数字生态。

那么，我们该如何驾驭这一趋势，高效地构建属于自己的智能体？这就需要一个成熟、完整的技术生态作为支撑。在本节中，我们将系统性地介绍当前智能体开发领域最具影响力的技术体系 ------LangChain 生态，它为开发者提供了一整套从底层组件到上层架构的项目化解决方案。

1.2.1 框架定位与发展历程

在智能体开发技术选型中，Python 凭借其语言特性与生态系统，确立了核心地位。简洁的语法、成熟的科学计算库（如 NumPy、Pandas）及主流深度学习框架（如 PyTorch、TensorFlow）的支持，使其成为 AI 研究与原型验证的首选语言。尤其在快速迭代的智能体与大模型领域，Python 的灵活性与活跃的社区，使其成为各类框架与工具链的默认语言环境。

与此同时，市场也涌现出诸多低代码智能体构建平台，例如 Coze、Dify、n8n 等。此类平台通过可视化页面与拖拽式交互，降低了智能体的构建门槛，使业务人员能快速配置简单的对话机器人或自动化流程。

然而，在企业级复杂场景中，这类平台通常会面临以下局限性。

（1）功能封装过重：难以实现精细的逻辑控制与定制化算法。

（2）集成能力有限：与企业内部异构系统、私有数据源深度打通困难。

（3）扩展性瓶颈：当业务规模增长或需要高度定制行为时，平台本身成为约束。

（4）模型与数据约束：部分平台绑定特定的模型服务，难以灵活切换或实现私有化部署。

因此，当目标转向构建高性能、可深度集成、全生命周期可控的企业级智能体时，编程式开发仍是不可替代的路径。LangChain 生态正是在这一背景下应运而生的核心基础设施。

1. LangChain 的框架定位

设计 LangChain 的初衷是为大模型开发提供一个模块化、可组合化的开发框架。LangChain 是介于大模型与应用之间的中间层，让开发者能够以一致的方式调用多种大模型、组织提示词、管理上下文状态并集成外部工具与数据源，从而高效构建出具备推理与行动能力的智能体。

其核心定位可概括为以下三个方面。（1）连接大模型与应用：通过统一接口，将大模型与数据库、检索引擎、API、文件系统等外部资源连接。（2）封装复杂逻辑：封装智能体所需的复杂模式，如工具调用、记忆等抽象层，降低开发复杂度。（3）支持多智能体协作与状态管理：随着 LangGraph 与 Deep Agent 的加入，LangChain 生态已从单智能体向多智能体协作扩展，甚至可以打造对标 Manus 的工业级智能体。

2. LangChain 的发展历程

LangChain 最早由机器学习项目工程师哈里森・蔡斯 （Harrison Chase）于 2022 年年底发布，最初旨在更好地组织和管理提示词。随着大模型技术爆发式发展，LangChain 迅速演进为构建智能体的重要框架。其发展大致经历了以下四个阶段。

（1）探索期（2022 年 Q4---2023 年 Q1）：LangChain 初版发布，主要聚焦于 PromptTemplate、LLMChain 等基础模块。其凭借前瞻性设计，在开源社区迅速走红，GitHub Star 数快速破万，成为早期最受关注的大模型应用框架。

（2）体系化阶段（2023 年 Q2---2023 年 Q4）：引入 Tool 、Agent、Retrieval 等概念，形成大模型 + 工具调用 + 记忆的核心架构，支持构建完成复杂任务的自动化智能体。同期推出 LangChain Hub 与 LangSmith，初步构建了从开发、调试到部署的生态闭环。

（3）平台化阶段（2024 年 ---2025 年上半年）：LangGraph 与 LangServe 的发布是这一阶段的标志。LangGraph 为工作流管理提供了有向图基础，而 LangServe 则解决了服务部署的难题。至此，LangChain 生态完成了从开发框架到智能体平台的跃升。

（4）深层智能体阶段（2025 年下半年至今）：正式推出 Deep Agent，官方定位为 Agent Harness（智能体执行框架），在 LangGraph 和 LangChain 之上运行，标志着 LangChain 生态进入新阶段，让开发者可构建基于多智能体的复杂化智能体系。

截至 2025 年 11 月，LangChain 生态形成了三层技术栈：LangChain→LangGraph→Deep Agent，分别对应基础能力层、运行时编排与智能体抽象层。这三层共同构成了一个从底层组件到高层自治行为的技术闭环。当下提及的 LangChain，往往指的是这个不断进化的生态体系，而不仅仅是其最初的 LangChain 基础框架部分。

3. 多语言支持与 Python 的核心地位

LangChain 生态支持包括 Python 和 JavaScript 语言实现。其中，Python 版本仍是功能最完整、更新最及时、社区最活跃的核心实现。原因主要有以下三点。

（1）生态协同优势：Python 生态在 AI 研发领域积累深厚，与主流的模型服务（如 OpenAI、Anthropic、Ollama）高度兼容。

（2）社区驱动创新：社区贡献丰富，大量第三方组件、示例和模板优先在 Python 端更新。

（3）技术前瞻保障：LangGraph、Deep Agent 等核心模块优先在 Python 端推出并维护。

因此，对于旨在构建可持续演进、深度定制且满足企业级要求的智能体系统的开发者而言，LangChain 的 Python 版无疑是首选。它既能支持快速验证原型，又能支撑企业级生产部署，本书后续的实践部分也将基于 Python 展开。

python 人工智能第一语言

1.2.2 生态体系介绍

经过持续迭代与演进，LangChain 已从一个独立的开发框架，成长为一个覆盖智能体系统全生命周期的技术生态。该生态由四大核心支柱构成：LangChain、LangGraph、Deep Agent 与 LangSmith，它们分别面向开发、编排、自治、监控与评估，共同构建了一个从技术验证到生产部署、从单体智能到复杂协作的项目闭环。

langchain 全家桶都有什么？

1. LangChain：智能体开发的基石

LangChain 是整个生态的核心与起点，扮演着语言模型项目化框架的角色。它将大模型从封闭的文本生成器拓展为能与外部环境交互的可编程智能单元，为开发者提供了模型调用、工具与中间件集成、智能体构建等一整套基础能力。

其核心价值主要体现在以下几个方面。

（1）统一的模型抽象层：屏蔽了不同模型服务提供商（如 OpenAI、Anthropic、Ollama 等）的接口差异，提供一致的调用方式。

（2）高度模块化的设计：使用 Message、Tool、Agent、Middleware 等组件实现灵活的组合与扩展。

（3）丰富的集成生态：预置了丰富的数据源、API、中间件等，构成了强大的 AI 能力枢纽。

在整体架构中，LangChain 如同智能体的操作系统内核，是所有上层能力构建的基础。

2. LangGraph（图）：复杂工作流的编排引擎

当智能体的任务从单一指令执行扩展为多步骤、有状态的复杂工作流时，LangGraph 应运而生。它作为生态中的运行时编排层，采用有向图结构来显式地定义和管理智能体的执行逻辑与状态流转。

其核心思想是将智能体内部抽象为一张有向图。

（1）节点（Node）：代表独立的功能单元或决策点。

（2）边（Edge）：定义了节点之间的流转条件与路径。

（3）状态（State）：作为一个共享上下文，在节点间传递并持久化存储任务信息。

通过这种图式结构，LangGraph 让智能体的工作流节点交互变得显式、可控、可观测。

3. Deep Agent：智能体的执行框架

Deep Agent 是新推出的全新组件，被定位为 Agent Harness（马鞍）（智能体执行框架）。它构建于 LangChain 与 LangGraph 之上，旨在让开发者无须从零构建复杂的控制逻辑，即可创建具备深度规划、长期记忆与多专家协作能力的智能体。

Deep Agent 的核心能力如下。

（1）显式规划：自主生成、执行并动态调整多步任务计划。

（2）虚拟文件系统：为智能体提供结构化的中间结果与知识存储。

（3）子智能体：支持任务在多个智能体之间的分解与协作。

（4）长期记忆：通过与 LangGraph 状态存储的结合，实现跨对话的经验积累。

（5）可扩展中间件：允许嵌入安全审计、性能监控或自定义业务逻辑。

LangChain 是基础框架，LangGraph 是在 LangChain 基础上的高级编排工具，Deep Agent 是在 LangChain 与 LangGraph 上实现可以处理复杂任务的智能体模板。

4. LangSmith：可观测性与质量管理平台

当智能体系统逐渐复杂时，单靠日志与打印输出（print）调试已无法满足调试与质量管理的需求。LangSmith 是 LangChain 官方推出的可观测性与质量管理平台，用于跟踪、记录和分析智能体在运行过程中的完整调用链路，让智能体的内部运行过程变得透明和可评估。

LangSmith 的核心目标如下。

（1）全链路追踪：可视化追踪模型调用、提示词输入、结果输出、工具使用等行为。

（2）调试与优化：发现运行中智能体的异常行为与性能瓶颈。

（3）评测与质量控制：支持人工与自动化评测，量化智能体表现。

（4）团队协作：支持多人共享测试集与调用记录。

LangSmith 的引入使得智能体的开发、调试与运维形成了完整的质量闭环。

总体而言，LangChain 生态体系的成熟，标志着智能体开发从工具链组合正式迈入平台化项目的新阶段。它不再仅仅关心如何构建功能，更系统地解决了如何编排、治理、部署、观测和评估一个复杂的智能体，为企业级智能体的落地提供了坚实、可靠的完整路径。

1.2.3 LangChain 1.0 说明

LangChain 1.0 的发布，是其发展历程中的一个 重要里程碑。自 2022 年年底问世后的将近三年时间里，LangChain 的版本号长期停留在 0.x，这反映了其在快速发展的 AI 生态中持续探索与迭代是相对谨慎的。此次其版本号直接跃迁至 1.0。这是真正意义上的第一个正式大版本，不仅代表了其 API 与架构的稳定（会长期支持一段时间），还象征着整个生态在思想上的统一与成熟。

1. 核心变革：从功能堆砌到体验统一

对于 LangChain 0.x 的老用户而言，普遍的体会是框架的臃肿与复杂。其模块众多、概念繁杂，虽然功能强大，但学习曲线杂乱，且在不同场景下的 API 设计存在不一致性。

LangChain 1.0 的核心目标之一，正是解决这一问题。它进行了一次彻底的架构重构与瘦身，其重点不在于增加新功能，而在于重塑开发者体验。通过废弃冗余 API、统一接口、明确最佳实践，新版本使得框架变得更为轻量、直观且易于维护。这对于降低开发者的工作量与开发难度、提升项目的长期可维护性具有重要意义。

2. 思想跃迁：从链式思维到智能体优先

回顾 LangChain 的演进，其命名源于最初的核心抽象 ------ 链（Chain），旨在将多个模型调用按顺序组合。随后，为了应对更复杂的控制流，LangGraph 引入了基于状态图的编排能力，成为构建复杂智能体的强大底层引擎。

LangChain 1.0 的另一个深远变革，是实现了从链式思维到智能体优先的设计哲学跃迁，它在 LangGraph 提供的强大编排能力之上，封装了一套更高级、更易用的智能体编程接口（create_agent 和 create_deep_agent），但是它的命名并没有延续用 LangGraph，最终还是选择叫 LangChain 1.0，因为 LangChain 的知名度更高一些。所以，有人戏称，LangChain 1.0 应该叫 LangGraph 2.0。LangChain 1.0 正式推出之后，LangGraph 下沉为底层框架，而又得益于 LangChain 1.0 中推出的另一项中间件特性，对于大多数开发场景，我们将不会再直接用到底层的 LangGraph API。

从开发者的角度来看，我们也不必纠结于 LangChain 和 LangGraph 这两者的关系，学习 LangChain 1.0 即可。

3. 技术基石：中间件与 Deep Agent

为了实现上述智能体优先范式，LangChain 1.0 引入了两项关键技术。

（1）中间件机制：这为智能体的执行流程提供了强大的可观测性与可控性。开发者可以方便地注入日志记录、组件监控等通用逻辑，而不必污染核心业务代码，这是构建企业级应用的基础。（就是 spring 的 AOP）

（2）Deep Agent：作为生态的前沿探索性质项目，它提供了一套更高阶的 Agent Harness。开发者可以在完全不知道 LangChain 与 LangGraph 底层规则情况下（Deep Agent 在上层做了封装），通过配置子智能体、文件系统路径、系统提示词和工具集等，即可快速组装出具备深度规划与协作能力的复杂智能体，而无须深入理解其底层的状态图实现细节，这降低了构建工业级智能体应用的门槛。

总体而言，LangChain 1.0 的发布，是一次以开发者体验和智能体范式为中心的战略升级。LangChain 1.0 利用架构重构统一了开发规范，利用高层 API 屏蔽了底层复杂性，并利用中间件等机制奠定了企业级应用的基石。对于开发者来说，这意味着可以更专注于智能体本身的行为逻辑与业务价值，而非框架的实现细节，从而可以更高效地构建面向未来的 AI 应用。