Agent三种思考模式深度解析:CoT/ReAct/Plan-and-Execute,小白程序员必看,助你轻松掌握大模型精髓(收藏版)

Agent怎么想问题:三种思考模式,决定了它有多聪明

同一个任务交给三个Agent,结果可能完全不同------不是因为它们"知道的"不一样,而是"想问题的方式"不一样。这篇用一个出差准备的真实场景,带你看懂CoT、ReAct、Plan-and-Execute三种主流思考模式的本质区别。

前言

--

上篇我们拆开了Agent的"机箱",看到了三个核心模块:大模型负责想,记忆负责记,工具负责做。

但有个问题没回答:大模型到底是"怎么想"的?

想象你面前有三个人,都很聪明,你问他们同一个问题:"我下周要去北京出差三天,帮我准备一下。"

第一个人坐在那想了五分钟,然后一口气说出完整方案:航班、酒店、会议资料、注意事项,逻辑清晰、滴水不漏。但在他说完之前,什么都没发生。

第二个人边说边做:先查了你的日历发现周二有冲突,立刻调整出发时间;订酒店时发现会议地点附近的酒店满了,马上换了一家地铁两站的;准备资料时发现缺一份数据,直接去找同事要了。全程走一步看一步,但每一步都在推进。

第三个人先花十分钟做了一份详细的任务清单,然后把"订机票""订酒店""准备资料"分成三条线同时推进------自己去准备资料,让另一个人查航班,让第三个人订酒店。效率最高,但前期规划花的时间也最多。

这三种做事风格,对应的就是Agent的三种主流思考模式。


一、CoT:想清楚再动手


1.1 什么是CoT

CoT,全称Chain of Thought,翻译过来就是"思维链"。

核心思路很简单:不要一步跳到答案,而是把思考过程一步步写出来。

你小时候做数学题,老师是不是总让你"写出解题步骤"?不是因为答案不重要,而是当你把每一步推理都写出来的时候,犯错的概率大大降低,即使错了也知道错在哪。

CoT就是同样的道理------让大模型"展示思考过程",而不是直接蹦答案。

1.2 出差案例:CoT怎么做

你对Agent说:"帮我准备下周去北京出差三天。"

CoT模式的Agent会这样思考:

思考第1步: 用户要去北京出差三天。我需要确定:出发时间、返回时间、出差目的、预算限制。

思考第2步: 用户说"下周",今天是周二,下周一到周三是合理的出差时间。需要查日历确认。

思考第3步: 出差需要准备这些事项:交通(机票/高铁)、住宿(酒店)、会议准备(资料/议程)、行程规划。

思考第4步: 按优先级排序------先定交通(时间敏感),再定住宿(依赖到达时间),然后准备资料(可以并行),最后整理行程表。

结论: 我需要按以下顺序执行------查日历 → 订机票 → 订酒店 → 准备会议资料 → 生成行程表。

然后把这个完整方案给你,或者开始逐步执行。

注意:整个思考过程中,Agent没有做任何实际操作------没查日历、没搜航班、没订酒店。它只是在"想"。想清楚了,再一步步做。

1.3 CoT的优势和局限

优势:

  • 推理质量高。 把思考过程展开后,每一步都可以检查,大幅减少"想歪了"的情况。Google的研究显示,使用CoT的大模型在复杂推理任务上的准确率提升了20-40%
  • 可解释性好。 你能看到Agent是怎么想的,不对可以及时纠正
  • 适合复杂逻辑。 多条件判断、数学计算、因果推理------需要"想清楚"的场景

局限:

  • 纸上谈兵。 如果现实和预期不符(比如航班取消了),它在"想"的阶段根本不知道,只有动手了才发现
  • 不适合动态任务。 环境在变、信息在更新的场景,想得再完美也可能执行时全变了

一句话记住CoT: 像一个谨慎的分析师------先在脑子里把问题想透了,再动手。适合需要深度推理的任务,不适合边做边变的场景。


二、ReAct:边想边做


2.1 什么是ReAct

ReAct,全称Reasoning + Acting,翻译过来就是"推理+行动"。

它的核心思路是:想一步,做一步,看一下结果,再决定下一步。

如果说CoT像闭卷考试(先全部想好再答题),ReAct就像开卷考试------你可以边答边翻书,随时根据新信息调整答案。

生活中你其实一直在用ReAct模式。比如做饭:你不会把所有步骤在脑子里排练完才动手。你会先热锅,发现油不够了------去拿油;放蒜,闻到香味了------下菜;翻炒几下,尝一口太淡了------加盐。每一步行动后都会观察结果,再决定下一步。

2.2 出差案例:ReAct怎么做

同样是"帮我准备下周去北京出差三天",ReAct模式的Agent是这样运转的:

想: 用户要出差,我先查一下日历确认下周的安排。

做: 调用日历工具,查看下周日程。

看: 发现周二下午有一个线上会议不能取消。

想: 周二下午有会,那出差时间最好是周一出发、周三返回,周二下午留出时间开线上会议。现在搜航班。

做: 搜索周一上午飞北京的航班。

看: 早班机最便宜的是7:20起飞,但需要5:30到机场。晚一点的9:40起飞,贵200但合理很多。

想: 用户不喜欢太早的航班(记忆中有偏好记录),推荐9:40那班。现在找酒店。

做: 搜索会议地点附近的酒店。

看: 距离最近的全季满房了,第二近的亚朵有房,步行8分钟。

想: 亚朵评分4.6,可以。接下来准备会议资料......

看到区别了吗?ReAct每一步都和真实世界交互 ------查日历发现有冲突,就调整时间;搜酒店发现满房,就换一家。不是先想好再做,而是做了才知道下一步该怎么想。

2.3 ReAct的优势和局限

优势:

  • 能应对变化。 现实世界信息不断变化------航班取消、酒店满房、临时加会。ReAct每一步都基于最新信息决策,不怕"计划赶不上变化"
  • 不需要一开始就掌握全部信息。 很多任务你不可能提前知道所有变量,ReAct允许你"做着做着搞清楚"
  • 最像人的做事方式。 你自己处理复杂任务时,大概率也是边做边调整

局限:

  • 容易"见树不见林"。 每一步只看眼前,可能缺乏全局规划。比如先订了最便宜的早班机,后来才发现酒店3点才能入住------早到了没地方去
  • 效率不一定高。 一步一步串行推进,遇到需要并行处理的任务就慢了
  • 可能陷入死循环。 如果两步之间互相依赖(酒店取决于航班时间,航班又想靠近酒店),Agent可能反复调整

一句话记住ReAct: 像一个经验丰富的侦探------到了现场先观察,发现线索就追,追到新线索再调整方向。适合信息不完整、情况会变化的任务。


三、Plan-and-Execute:先画蓝图,再分头干


3.1 什么是Plan-and-Execute

顾名思义,Plan-and-Execute就是"先规划,再执行"。

和CoT的区别在于:CoT想完了自己一步步做,Plan-and-Execute想完了拆成子任务,可以分头做

如果说CoT是自己闷头干的"个人英雄",Plan-and-Execute更像一个项目经理------先把大任务拆成小任务,分清先后和依赖关系,然后调度资源去执行,自己负责监控进度和协调。

装修房子就是典型的Plan-and-Execute:设计师先出整体方案和施工时间表,然后水电工、瓦工、油漆工按计划分头进场。设计师不用自己搬砖,但需要确保每个阶段按时完成、质量达标。

3.2 出差案例:Plan-and-Execute怎么做

同样是"帮我准备下周去北京出差三天":

规划阶段(Planner):

任务分解:

  1. 【日程确认】查日历,确定可用出差日期
  2. 【交通预订】搜索并预订机票/高铁(依赖任务1的日期结果)
  3. 【住宿预订】搜索并预订酒店(依赖任务2的到达时间)
  4. 【资料准备】整理会议所需文档和数据(与任务2、3并行)
  5. 【行程汇总】生成完整行程表(依赖任务1-4全部完成)

依赖关系:1 → 2 → 3,4可以和2、3同时进行,5最后做。

执行阶段(Executor):

先执行任务1:查日历 → 确定周一至周三。

然后同时 启动任务2(搜航班)和任务4(准备资料)。

任务2完成后启动任务3(订酒店)。

全部完成后执行任务5(汇总行程)。

监控阶段(Monitor):

执行到任务3时发现酒店满房 → 通知Planner。

Planner重新规划任务3:扩大搜索范围到地铁3站以内。

Executor按新方案继续执行。

关键区别: Plan-and-Execute有明确的"规划"和"执行"分离。规划者只想不做,执行者只做不想,中间有监控者协调。而且子任务可以并行------同时订机票和准备资料,而不是一件做完再做下一件。

3.3 Plan-and-Execute的优势和局限

优势:

  • 全局最优。 先看全貌再动手,避免"走一步算一步"导致的全局次优
  • 可以并行。 不相互依赖的子任务同时推进,效率大幅提升。这在多Agent协作中尤其重要------一个Agent订机票,另一个同时准备资料
  • 可控性强。 计划是透明的,你可以在执行前审核、修改计划

局限:

  • 前期成本高。 需要先投入时间做规划,对于简单任务是"杀鸡用牛刀"
  • 应对变化不够灵活。 虽然有监控和重新规划机制,但比ReAct的"随时调整"还是慢一拍
  • 规划本身可能出错。 如果一开始的任务分解就有遗漏,后面执行再完美也白搭

一句话记住Plan-and-Execute: 像一个高效的项目经理------先画甘特图,再调度团队分头执行。适合大型、可拆解、需要协调多个子任务的场景。


四、同一个任务,三种模式的真实对比


概念讲完了,回到开头的出差案例,把三种模式放在一起对比。

4.1 执行过程对比

同一个"准备出差"任务,三种模式的执行节奏完全不同:

CoT:一大段纯思考,想完了才动手。结果到执行阶段才发现酒店满房------想得再完美也白搭。

ReAct:想和做交替推进,每一步都能及时发现问题并调整。但全程串行,一步一步来,最慢。

Plan-and-Execute:前期花时间规划,但拆完子任务后可以并行------订机票和准备资料同时进行。总耗时最短。

4.2 一张表看清差异

4.3 真实产品里怎么用

你可能好奇:现在市面上的Agent产品,用的是哪种模式?

答案是:混合使用。

专业Agent产品:

Cursor写代码:典型的ReAct------读一段代码、想一下要改哪里、改了、运行一下看结果、不对再调整

Manus做研究任务:Plan-and-Execute------接到"帮我调研XX行业"的任务后,先列出调研大纲,再一个个子课题去搜索、总结、汇总

Devin写项目:也是Plan-and-Execute------先理解需求、设计方案,再拆成文件级别的子任务逐个实现

通用大模型:

DeepSeek(深度思考模式):开启后就是CoT------你能看到它一步步列出推理过程,尤其擅长数学和逻辑题。联网搜索时会切换到ReAct,边搜边分析

豆包:日常对话用CoT快速回答;复杂任务会自动启用"深度思考",展开更长的推理链;搜索联网时切换为ReAct模式

通义千问:和豆包类似,基础问答是CoT,开启"深度思考"后推理链更长更透彻。它的"万相"等多模态工具则是ReAct------生成图片后检查效果、不满意再调整

Claude(extended thinking):本质就是CoT------在回答复杂问题前,先展开一大段内部推理,想清楚再给你答案

而且很多成熟的Agent会动态切换:简单问题用CoT快速推理,碰到需要搜索的就切ReAct,遇到大任务就启动Plan-and-Execute。就像一个老练的员工,不会所有事都用同一种方法处理。


五、怎么选:一张决策图


实际使用中,你不需要记住这些术语。但理解它们背后的逻辑,能帮你判断什么样的Agent适合什么样的任务

简单记忆法:

任务需要深度思考? → CoT(比如:帮我分析这份财报、这个方案有没有漏洞)

任务需要和外部交互、信息会变? → ReAct(比如:帮我订机票、帮我调试这段代码)

任务很大、可以拆成多个独立子任务? → Plan-and-Execute(比如:帮我做一份完整的竞品报告、帮我组织一场活动)

当然,最好的Agent不让你选------它自己就知道什么时候该想、什么时候该做、什么时候该拆。 这也是Agent技术接下来进化的方向。


总结

--

回到开头的三个人:分析师(CoT)想得最透,侦探(ReAct)最能随机应变,项目经理(Plan-and-Execute)协调效率最高。

没有最好的思考模式,只有最合适的。 就像你自己------做决策时用分析思维,处理突发时凭经验灵活应对,管项目时用甘特图和分工表。

一句话带走:Agent的"聪明程度"不只取决于大模型多强,还取决于它用什么方式思考------CoT给它推理深度,ReAct给它适应能力,Plan-and-Execute给它协调效率。三者结合,才是真正聪明的Agent。


普通人如何抓住AI大模型的风口?

领取方式在文末

为什么要学习大模型?

目前AI大模型的技术岗位与能力培养随着人工智能技术的迅速发展和应用 , 大模型作为其中的重要组成部分 , 正逐渐成为推动人工智能发展的重要引擎 。大模型以其强大的数据处理和模式识别能力, 广泛应用于自然语言处理 、计算机视觉 、 智能推荐等领域 ,为各行各业带来了革命性的改变和机遇 。

目前,开源人工智能大模型已应用于医疗、政务、法律、汽车、娱乐、金融、互联网、教育、制造业、企业服务等多个场景,其中,应用于金融、企业服务、制造业和法律领域的大模型在本次调研中占比超过 30%。

随着AI大模型技术的迅速发展,相关岗位的需求也日益增加。大模型产业链催生了一批高薪新职业:

人工智能大潮已来,不加入就可能被淘汰。如果你是技术人,尤其是互联网从业者,现在就开始学习AI大模型技术,真的是给你的人生一个重要建议!

最后

只要你真心想学习AI大模型技术,这份精心整理的学习资料我愿意无偿分享给你,但是想学技术去乱搞的人别来找我!

在当前这个人工智能高速发展的时代,AI大模型正在深刻改变各行各业。我国对高水平AI人才的需求也日益增长,真正懂技术、能落地的人才依旧紧缺。我也希望通过这份资料,能够帮助更多有志于AI领域的朋友入门并深入学习。

真诚无偿分享!!!
vx扫描下方二维码即可
加上后会一个个给大家发

【附赠一节免费的直播讲座,技术大佬带你学习大模型的相关知识、学习思路、就业前景以及怎么结合当前的工作发展方向等,欢迎大家~】

大模型全套学习资料展示

自我们与MoPaaS魔泊云 合作以来,我们不断打磨课程体系与技术内容,在细节上精益求精,同时在技术层面也新增了许多前沿且实用的内容,力求为大家带来更系统、更实战、更落地的大模型学习体验。

希望这份系统、实用的大模型学习路径,能够帮助你从零入门,进阶到实战,真正掌握AI时代的核心技能!

01 教学内容

  • 从零到精通完整闭环:【基础理论 →RAG开发 → Agent设计 → 模型微调与私有化部署调→热门技术】5大模块,内容比传统教材更贴近企业实战!

  • 大量真实项目案例: 带你亲自上手搞数据清洗、模型调优这些硬核操作,把课本知识变成真本事‌!

02适学人群

应届毕业生‌: 无工作经验但想要系统学习AI大模型技术,期待通过实战项目掌握核心技术。

零基础转型‌: 非技术背景但关注AI应用场景,计划通过低代码工具实现"AI+行业"跨界‌。

业务赋能突破瓶颈: 传统开发者(Java/前端等)学习Transformer架构与LangChain框架,向AI全栈工程师转型‌。

vx扫描下方二维码即可

【附赠一节免费的直播讲座,技术大佬带你学习大模型的相关知识、学习思路、就业前景以及怎么结合当前的工作发展方向等,欢迎大家~】

本教程比较珍贵,仅限大家自行学习,不要传播!更严禁商用!

03 入门到进阶学习路线图

大模型学习路线图,整体分为5个大的阶段:

04 视频和书籍PDF合集

从0到掌握主流大模型技术视频教程(涵盖模型训练、微调、RAG、LangChain、Agent开发等实战方向)

新手必备的大模型学习PDF书单来了!全是硬核知识,帮你少走弯路(不吹牛,真有用)

05 行业报告+白皮书合集

收集70+报告与白皮书,了解行业最新动态!

06 90+份面试题/经验

AI大模型岗位面试经验总结(谁学技术不是为了赚$呢,找个好的岗位很重要)

07 deepseek部署包+技巧大全

由于篇幅有限

只展示部分资料

并且还在持续更新中...

真诚无偿分享!!!
vx扫描下方二维码即可
加上后会一个个给大家发

【附赠一节免费的直播讲座,技术大佬带你学习大模型的相关知识、学习思路、就业前景以及怎么结合当前的工作发展方向等,欢迎大家~】

相关推荐
塔能物联运维1 小时前
存量机房降本增效:两相液冷技术解锁全生命周期成本优化密码
大数据·人工智能
小江的记录本1 小时前
【Java基础】核心关键字:final、static、volatile、synchronized、transient(附《思维导图》+《面试高频考点清单》)
java·前端·数据结构·后端·ai·面试·ai编程
黎阳之光1 小时前
黎阳之光:视频孪生智慧厂网一体化解决方案|污水处理全场景智能化升级
大数据·人工智能·物联网·安全·数字孪生
Omics Pro1 小时前
填补蛋白质组深度学习预处理教学空白
人工智能·python·深度学习·plotly·numpy·pandas·scikit-learn
LN花开富贵2 小时前
Ubuntu aarch64 架构安装 NoMachine 远程控制 避坑与实战
linux·运维·笔记·学习·ubuntu·嵌入式
me8322 小时前
【AI】踩坑LangChain4j集成千问模型:版本适配问题完整解决历程
java·spring·阿里云·ai
JavaPub-rodert2 小时前
Codex + cc-switch + GPT-5.5 国内使用教程:从注册 API 到接入 VS Code / Cursor,一篇讲清楚
人工智能·gpt·开源·codex·ccswitch
AI技术控2 小时前
RAG 怎么做 Query 改写?从工程实践看检索增强生成的第一道关键关卡
人工智能·语言模型·自然语言处理·oracle·nlp
解局易否结局2 小时前
ops-transformer 的 FlashAttention:给昇腾NPU 配了个“高效厨房“
人工智能·深度学习·transformer