学习 Agent 基础概念及不同 Agent 的适用场景

一、前言

[一、什么是 Agent](#一、什么是 Agent)

[二、LLM 与 Agent 的区别](#二、LLM 与 Agent 的区别)

[三、Agent 的核心组成](#三、Agent 的核心组成)

[四、Agent 工作流程](#四、Agent 工作流程)

[五、为什么需要 Agent](#五、为什么需要 Agent)

[六、Agent 的四大能力](#六、Agent 的四大能力)

[七、ReAct Agent](#七、ReAct Agent)

[八、Tool Calling Agent](#八、Tool Calling Agent)

[九、RAG Agent](#九、RAG Agent)

[十、Code Agent](#十、Code Agent)

[十一、Workflow Agent](#十一、Workflow Agent)

[十二、Autonomous Agent](#十二、Autonomous Agent)

[十三、Single Agent（单智能体）](#十三、Single Agent（单智能体）)

十四、Multi-Agent（多智能体）

[十五、企业项目如何选择 Agent](#十五、企业项目如何选择 Agent)

[十六、LangChain Agent 架构](#十六、LangChain Agent 架构)

[十七、LangGraph Agent 架构](#十七、LangGraph Agent 架构)

[十八、Agent 与传统程序区别](#十八、Agent 与传统程序区别)

十九、面试高频问题

[什么是 Agent？](#什么是 Agent？)

[Agent 与 LLM 的区别？](#Agent 与 LLM 的区别？)

[ReAct 是什么？](#ReAct 是什么？)

[RAG Agent 适用于什么场景？](#RAG Agent 适用于什么场景？)

[单 Agent 与多 Agent 区别？](#单 Agent 与多 Agent 区别？)

二十、总结

随着 ChatGPT、Claude、DeepSeek 等大模型的发展，一个新的概念越来越频繁地出现在 AI 技术领域：

复制代码

Agent

中文通常翻译为：

复制代码

智能体

很多初学者第一次接触 Agent 时都会产生疑问：

复制代码

Agent 和 LLM 有什么区别？

为什么需要 Agent？

Agent 是不是就是大模型？

Agent 能做什么？

多 Agent 又是什么？

事实上：

复制代码

LLM ≠ Agent

LLM 只是 Agent 的"大脑"。

而 Agent 则是：

复制代码

会思考

会规划

会调用工具

会执行任务

会反馈结果

的完整智能系统。

本文将带你全面掌握：

复制代码

Agent 的基本概念

Agent 的核心组成

Agent 的工作原理

不同 Agent 的分类

单智能体与多智能体

企业级应用场景

一、什么是 Agent

Agent（智能体）的定义：

复制代码

能够感知环境

进行决策

执行动作

完成目标

的智能系统

现实中的例子：

复制代码

人类

就是一个天然 Agent。

因为人类能够：

复制代码

观察世界

分析问题

制定计划

采取行动

获得反馈

例如：

复制代码

目标：

订一张机票

人类会：

复制代码

查询航班

比较价格

选择时间

支付订单

最终完成目标。

Agent 也是类似过程。

二、LLM 与 Agent 的区别

很多人误以为：

复制代码

ChatGPT 就是 Agent

实际上：

复制代码

ChatGPT 更像是 LLM

区别：

能力	LLM	Agent
对话	√	√
推理	√	√
调用工具	×	√
制定计划	×	√
执行任务	×	√
自主决策	×	√

可以理解为：

复制代码

LLM
负责思考

Agent
负责做事

三、Agent 的核心组成

一个完整 Agent 通常包含：

复制代码

LLM

Memory

Tools

Planner

Executor

架构：

四、Agent 工作流程

以查询天气为例：

用户：

复制代码

北京今天天气怎么样？

Agent 执行：

复制代码

识别意图

↓

发现需要天气数据

↓

调用天气API

↓

获取结果

↓

生成回答

流程图：

五、为什么需要 Agent

普通 LLM：

复制代码

只能聊天

例如：

复制代码

帮我查今天上海天气

LLM：

复制代码

我无法访问实时天气

Agent：

复制代码

调用天气工具

获取实时数据

返回结果

因此：

复制代码

Agent

=

LLM

+

工具能力

六、Agent 的四大能力

1、感知能力

接收：

复制代码

文本

图片

音频

视频

信息。

2、推理能力

分析：

复制代码

用户意图

任务目标

执行步骤

3、行动能力

调用：

复制代码

API

数据库

搜索引擎

代码解释器

4、学习能力

利用：

复制代码

Memory

知识库

历史记录

持续优化。

七、ReAct Agent

目前最经典的 Agent 模式：

复制代码

ReAct

全称：

复制代码

Reason + Act

即：

复制代码

推理

+

行动

流程：

示例：

复制代码

问题：

今天北京天气？

Agent：

复制代码

Thought：
需要查询天气

Action：
调用天气API

Observation：
获取天气数据

Answer：
返回结果

八、Tool Calling Agent

Tool Calling 是当前最主流模式。

Agent 可以调用：

复制代码

搜索引擎

数据库

计算器

代码执行器

企业API

架构：

适用场景：

复制代码

企业办公系统

客服机器人

数据查询平台

九、RAG Agent

RAG Agent：

复制代码

Agent

+

知识库

架构：

适用：

复制代码

企业知识库

智能客服

内部问答系统

十、Code Agent

Code Agent：

复制代码

能够执行代码

例如：

复制代码

计算Excel数据

生成图表

分析CSV文件

自动编程

流程：

适用：

复制代码

数据分析

自动化办公

代码生成

十一、Workflow Agent

Workflow Agent：

复制代码

固定流程执行

例如：

复制代码

审批流程

报销流程

工单系统

特点：

复制代码

可控

稳定

易维护

适合：

复制代码

企业业务系统

十二、Autonomous Agent

Autonomous Agent：

复制代码

自主智能体

能够：

复制代码

自主规划

自主执行

自主迭代

典型代表：

复制代码

AutoGPT

BabyAGI

流程：

优点：

复制代码

自动化程度高

缺点：

复制代码

成本高

不可控

十三、Single Agent（单智能体）

单 Agent 架构：

特点：

复制代码

简单

开发快

成本低

适用：

复制代码

客服系统

问答机器人

知识库助手

十四、Multi-Agent（多智能体）

多个 Agent 协同工作。

例如：

复制代码

产品经理Agent

开发Agent

测试Agent

运维Agent

架构：

优点：

复制代码

专业分工

复杂任务处理能力强

缺点：

复制代码

架构复杂

成本较高

十五、企业项目如何选择 Agent

小型项目：

复制代码

单Agent

即可。

知识库项目：

复制代码

RAG Agent

最适合。

数据分析：

复制代码

Code Agent

效果最好。

复杂协同任务：

复制代码

Multi-Agent

更合理。

十六、LangChain Agent 架构

LangChain 提供：

复制代码

Agent

Tool

Memory

Retriever

能力。

架构：

十七、LangGraph Agent 架构

LangGraph 适合：

复制代码

复杂Agent流程

特点：

复制代码

状态管理

流程控制

多Agent协作

架构：

适合：

复制代码

企业级Agent系统

十八、Agent 与传统程序区别

传统程序：

复制代码

固定逻辑

例如：

复制代码

if(a>b){
    return a;
}

Agent：

复制代码

动态决策

例如：

复制代码

先搜索

再分析

再生成答案

因此：

复制代码

传统程序

关注流程

Agent

关注目标

十九、面试高频问题

什么是 Agent？

复制代码

能够自主完成任务的智能系统

Agent 与 LLM 的区别？

复制代码

LLM负责思考

Agent负责执行

ReAct 是什么？

复制代码

Reason + Act

推理加行动

RAG Agent 适用于什么场景？

复制代码

知识库问答

企业客服

单 Agent 与多 Agent 区别？

复制代码

单Agent简单

多Agent协作能力更强

二十、总结

Agent 是当前 AI 应用落地的核心方向之一。

其本质可以理解为：

复制代码

Agent

=

LLM

+

Memory

+

Tools

+

Planning

+

Execution

整个工作流程：

复制代码

用户目标
      ↓
Agent分析
      ↓
任务规划
      ↓
工具调用
      ↓
结果反馈
      ↓
最终回答

可以这样理解：

复制代码

LLM
像人的大脑

Memory
像人的记忆

Tools
像人的双手

Agent
像完整的人

因此：

LLM 决定智能上限，Agent 决定实际生产力。

掌握 Agent 后，你就真正进入了 AI 应用开发的核心阶段，为后续学习 ReAct Agent、Tool Calling、LangGraph、Multi-Agent、AutoGen、CrewAI 等高级 Agent 框架打下坚实基础。