学习 Agent 基础概念及不同 Agent 的适用场景

目录

一、前言

[一、什么是 Agent](#一、什么是 Agent)

[二、LLM 与 Agent 的区别](#二、LLM 与 Agent 的区别)

[三、Agent 的核心组成](#三、Agent 的核心组成)

[四、Agent 工作流程](#四、Agent 工作流程)

[五、为什么需要 Agent](#五、为什么需要 Agent)

[六、Agent 的四大能力](#六、Agent 的四大能力)

1、感知能力

2、推理能力

3、行动能力

4、学习能力

[七、ReAct Agent](#七、ReAct Agent)

[八、Tool Calling Agent](#八、Tool Calling Agent)

[九、RAG Agent](#九、RAG Agent)

[十、Code Agent](#十、Code Agent)

[十一、Workflow Agent](#十一、Workflow Agent)

[十二、Autonomous Agent](#十二、Autonomous Agent)

[十三、Single Agent(单智能体)](#十三、Single Agent(单智能体))

十四、Multi-Agent(多智能体)

[十五、企业项目如何选择 Agent](#十五、企业项目如何选择 Agent)

[十六、LangChain Agent 架构](#十六、LangChain Agent 架构)

[十七、LangGraph Agent 架构](#十七、LangGraph Agent 架构)

[十八、Agent 与传统程序区别](#十八、Agent 与传统程序区别)

十九、面试高频问题

[什么是 Agent?](#什么是 Agent?)

[Agent 与 LLM 的区别?](#Agent 与 LLM 的区别?)

[ReAct 是什么?](#ReAct 是什么?)

[RAG Agent 适用于什么场景?](#RAG Agent 适用于什么场景?)

[单 Agent 与多 Agent 区别?](#单 Agent 与多 Agent 区别?)

二十、总结


随着 ChatGPT、Claude、DeepSeek 等大模型的发展,一个新的概念越来越频繁地出现在 AI 技术领域:

复制代码
Agent

中文通常翻译为:

复制代码
智能体

很多初学者第一次接触 Agent 时都会产生疑问:

复制代码
Agent 和 LLM 有什么区别?

为什么需要 Agent?

Agent 是不是就是大模型?

Agent 能做什么?

多 Agent 又是什么?

事实上:

复制代码
LLM ≠ Agent

LLM 只是 Agent 的"大脑"。

而 Agent 则是:

复制代码
会思考

会规划

会调用工具

会执行任务

会反馈结果

的完整智能系统。

本文将带你全面掌握:

复制代码
Agent 的基本概念

Agent 的核心组成

Agent 的工作原理

不同 Agent 的分类

单智能体与多智能体

企业级应用场景

一、什么是 Agent

Agent(智能体)的定义:

复制代码
能够感知环境

进行决策

执行动作

完成目标

的智能系统

现实中的例子:

复制代码
人类

就是一个天然 Agent。

因为人类能够:

复制代码
观察世界

分析问题

制定计划

采取行动

获得反馈

例如:

复制代码
目标:

订一张机票

人类会:

复制代码
查询航班

比较价格

选择时间

支付订单

最终完成目标。


Agent 也是类似过程。


二、LLM 与 Agent 的区别

很多人误以为:

复制代码
ChatGPT 就是 Agent

实际上:

复制代码
ChatGPT 更像是 LLM

区别:

能力 LLM Agent
对话
推理
调用工具 ×
制定计划 ×
执行任务 ×
自主决策 ×

可以理解为:

复制代码
LLM
负责思考

Agent
负责做事

三、Agent 的核心组成

一个完整 Agent 通常包含:

复制代码
LLM

Memory

Tools

Planner

Executor

架构:


四、Agent 工作流程

以查询天气为例:

用户:

复制代码
北京今天天气怎么样?

Agent 执行:

复制代码
识别意图

↓

发现需要天气数据

↓

调用天气API

↓

获取结果

↓

生成回答

流程图:


五、为什么需要 Agent

普通 LLM:

复制代码
只能聊天

例如:

复制代码
帮我查今天上海天气

LLM:

复制代码
我无法访问实时天气

Agent:

复制代码
调用天气工具

获取实时数据

返回结果

因此:

复制代码
Agent

=

LLM

+

工具能力

六、Agent 的四大能力

1、感知能力

接收:

复制代码
文本

图片

音频

视频

信息。


2、推理能力

分析:

复制代码
用户意图

任务目标

执行步骤

3、行动能力

调用:

复制代码
API

数据库

搜索引擎

代码解释器

4、学习能力

利用:

复制代码
Memory

知识库

历史记录

持续优化。


七、ReAct Agent

目前最经典的 Agent 模式:

复制代码
ReAct

全称:

复制代码
Reason + Act

即:

复制代码
推理

+

行动

流程:


示例:

复制代码
问题:

今天北京天气?

Agent:

复制代码
Thought:
需要查询天气

Action:
调用天气API

Observation:
获取天气数据

Answer:
返回结果

八、Tool Calling Agent

Tool Calling 是当前最主流模式。

Agent 可以调用:

复制代码
搜索引擎

数据库

计算器

代码执行器

企业API

架构:


适用场景:

复制代码
企业办公系统

客服机器人

数据查询平台

九、RAG Agent

RAG Agent:

复制代码
Agent

+

知识库

架构:


适用:

复制代码
企业知识库

智能客服

内部问答系统

十、Code Agent

Code Agent:

复制代码
能够执行代码

例如:

复制代码
计算Excel数据

生成图表

分析CSV文件

自动编程

流程:


适用:

复制代码
数据分析

自动化办公

代码生成

十一、Workflow Agent

Workflow Agent:

复制代码
固定流程执行

例如:

复制代码
审批流程

报销流程

工单系统

特点:

复制代码
可控

稳定

易维护

适合:

复制代码
企业业务系统

十二、Autonomous Agent

Autonomous Agent:

复制代码
自主智能体

能够:

复制代码
自主规划

自主执行

自主迭代

典型代表:

复制代码
AutoGPT

BabyAGI

流程:


优点:

复制代码
自动化程度高

缺点:

复制代码
成本高

不可控

十三、Single Agent(单智能体)

单 Agent 架构:


特点:

复制代码
简单

开发快

成本低

适用:

复制代码
客服系统

问答机器人

知识库助手

十四、Multi-Agent(多智能体)

多个 Agent 协同工作。

例如:

复制代码
产品经理Agent

开发Agent

测试Agent

运维Agent

架构:


优点:

复制代码
专业分工

复杂任务处理能力强

缺点:

复制代码
架构复杂

成本较高

十五、企业项目如何选择 Agent

小型项目:

复制代码
单Agent

即可。


知识库项目:

复制代码
RAG Agent

最适合。


数据分析:

复制代码
Code Agent

效果最好。


复杂协同任务:

复制代码
Multi-Agent

更合理。


十六、LangChain Agent 架构

LangChain 提供:

复制代码
Agent

Tool

Memory

Retriever

能力。


架构:


十七、LangGraph Agent 架构

LangGraph 适合:

复制代码
复杂Agent流程

特点:

复制代码
状态管理

流程控制

多Agent协作

架构:


适合:

复制代码
企业级Agent系统

十八、Agent 与传统程序区别

传统程序:

复制代码
固定逻辑

例如:

复制代码
if(a>b){
    return a;
}

Agent:

复制代码
动态决策

例如:

复制代码
先搜索

再分析

再生成答案

因此:

复制代码
传统程序

关注流程

Agent

关注目标

十九、面试高频问题

什么是 Agent?

复制代码
能够自主完成任务的智能系统

Agent 与 LLM 的区别?

复制代码
LLM负责思考

Agent负责执行

ReAct 是什么?

复制代码
Reason + Act

推理加行动

RAG Agent 适用于什么场景?

复制代码
知识库问答

企业客服

单 Agent 与多 Agent 区别?

复制代码
单Agent简单

多Agent协作能力更强

二十、总结

Agent 是当前 AI 应用落地的核心方向之一。

其本质可以理解为:

复制代码
Agent

=

LLM

+

Memory

+

Tools

+

Planning

+

Execution

整个工作流程:

复制代码
用户目标
      ↓
Agent分析
      ↓
任务规划
      ↓
工具调用
      ↓
结果反馈
      ↓
最终回答

可以这样理解:

复制代码
LLM
像人的大脑

Memory
像人的记忆

Tools
像人的双手

Agent
像完整的人

因此:

LLM 决定智能上限,Agent 决定实际生产力。

掌握 Agent 后,你就真正进入了 AI 应用开发的核心阶段,为后续学习 ReAct Agent、Tool Calling、LangGraph、Multi-Agent、AutoGen、CrewAI 等高级 Agent 框架打下坚实基础。

相关推荐
chsmiao2 小时前
深度学习之线性代数
人工智能·深度学习·线性代数
dozenyaoyida2 小时前
AI与大模型新闻日报 | 2026-06-01
人工智能·ai·大模型·新闻
wenzhangli73 小时前
AI-IDE 关键技术解析:从自然语言到企业级智能开发平台的架构演进
ide·人工智能·架构
百胜软件@百胜软件3 小时前
从“数据孤岛”到“智利标杆”:百胜E3全渠道中台助力“名创优品”Newtree实现一体化智变
大数据·人工智能·零售数字化·数智中台·珠宝行业
lizhihai_993 小时前
股市学习心得-A股服务器/算力服务器龙头
大数据·运维·服务器·人工智能·科技·学习
D_FW3 小时前
Claude Code Hooks 实战指南
ai
weixin_446260853 小时前
通过世界模拟器进行具象化视觉空间推理 (Astra)
人工智能
黎阳之光3 小时前
数智赋能水厂全链路安全|黎阳之光以视频孪生技术落地供水精细化管控
人工智能·物联网·算法·安全·数字孪生
金融RPA机器人丨实在智能3 小时前
即通过视觉识别技术为现有GUI软件加上“AI适配器”
人工智能·ai