Agent三种思考模式深度解析：CoT/ReAct/Plan-and-Execute，小白程序员必看，助你轻松掌握大模型精髓（收藏版）

Agent怎么想问题：三种思考模式，决定了它有多聪明

同一个任务交给三个Agent，结果可能完全不同------不是因为它们"知道的"不一样，而是"想问题的方式"不一样。这篇用一个出差准备的真实场景，带你看懂CoT、ReAct、Plan-and-Execute三种主流思考模式的本质区别。

前言

上篇我们拆开了Agent的"机箱"，看到了三个核心模块：大模型负责想，记忆负责记，工具负责做。

但有个问题没回答：大模型到底是"怎么想"的？

想象你面前有三个人，都很聪明，你问他们同一个问题："我下周要去北京出差三天，帮我准备一下。"

第一个人坐在那想了五分钟，然后一口气说出完整方案：航班、酒店、会议资料、注意事项，逻辑清晰、滴水不漏。但在他说完之前，什么都没发生。

第二个人边说边做：先查了你的日历发现周二有冲突，立刻调整出发时间；订酒店时发现会议地点附近的酒店满了，马上换了一家地铁两站的；准备资料时发现缺一份数据，直接去找同事要了。全程走一步看一步，但每一步都在推进。

第三个人先花十分钟做了一份详细的任务清单，然后把"订机票""订酒店""准备资料"分成三条线同时推进------自己去准备资料，让另一个人查航班，让第三个人订酒店。效率最高，但前期规划花的时间也最多。

这三种做事风格，对应的就是Agent的三种主流思考模式。

一、CoT：想清楚再动手

1.1 什么是CoT

CoT，全称Chain of Thought，翻译过来就是"思维链"。

核心思路很简单：不要一步跳到答案，而是把思考过程一步步写出来。

你小时候做数学题，老师是不是总让你"写出解题步骤"？不是因为答案不重要，而是当你把每一步推理都写出来的时候，犯错的概率大大降低，即使错了也知道错在哪。

CoT就是同样的道理------让大模型"展示思考过程"，而不是直接蹦答案。

1.2 出差案例：CoT怎么做

你对Agent说："帮我准备下周去北京出差三天。"

CoT模式的Agent会这样思考：

思考第1步： 用户要去北京出差三天。我需要确定：出发时间、返回时间、出差目的、预算限制。

思考第2步： 用户说"下周"，今天是周二，下周一到周三是合理的出差时间。需要查日历确认。

思考第3步： 出差需要准备这些事项：交通（机票/高铁）、住宿（酒店）、会议准备（资料/议程）、行程规划。

思考第4步： 按优先级排序------先定交通（时间敏感），再定住宿（依赖到达时间），然后准备资料（可以并行），最后整理行程表。

结论： 我需要按以下顺序执行------查日历 → 订机票 → 订酒店 → 准备会议资料 → 生成行程表。

然后把这个完整方案给你，或者开始逐步执行。

注意：整个思考过程中，Agent没有做任何实际操作------没查日历、没搜航班、没订酒店。它只是在"想"。想清楚了，再一步步做。

1.3 CoT的优势和局限

优势：

推理质量高。 把思考过程展开后，每一步都可以检查，大幅减少"想歪了"的情况。Google的研究显示，使用CoT的大模型在复杂推理任务上的准确率提升了20-40%
可解释性好。 你能看到Agent是怎么想的，不对可以及时纠正
适合复杂逻辑。 多条件判断、数学计算、因果推理------需要"想清楚"的场景

局限：

纸上谈兵。 如果现实和预期不符（比如航班取消了），它在"想"的阶段根本不知道，只有动手了才发现
不适合动态任务。 环境在变、信息在更新的场景，想得再完美也可能执行时全变了

一句话记住CoT： 像一个谨慎的分析师------先在脑子里把问题想透了，再动手。适合需要深度推理的任务，不适合边做边变的场景。

二、ReAct：边想边做

2.1 什么是ReAct

ReAct，全称Reasoning + Acting，翻译过来就是"推理+行动"。

它的核心思路是：想一步，做一步，看一下结果，再决定下一步。

如果说CoT像闭卷考试（先全部想好再答题），ReAct就像开卷考试------你可以边答边翻书，随时根据新信息调整答案。

生活中你其实一直在用ReAct模式。比如做饭：你不会把所有步骤在脑子里排练完才动手。你会先热锅，发现油不够了------去拿油；放蒜，闻到香味了------下菜；翻炒几下，尝一口太淡了------加盐。每一步行动后都会观察结果，再决定下一步。

2.2 出差案例：ReAct怎么做

同样是"帮我准备下周去北京出差三天"，ReAct模式的Agent是这样运转的：

想：用户要出差，我先查一下日历确认下周的安排。

做：调用日历工具，查看下周日程。

看：发现周二下午有一个线上会议不能取消。

想：周二下午有会，那出差时间最好是周一出发、周三返回，周二下午留出时间开线上会议。现在搜航班。

做：搜索周一上午飞北京的航班。

看：早班机最便宜的是7:20起飞，但需要5:30到机场。晚一点的9:40起飞，贵200但合理很多。

想：用户不喜欢太早的航班（记忆中有偏好记录），推荐9:40那班。现在找酒店。

做：搜索会议地点附近的酒店。

看：距离最近的全季满房了，第二近的亚朵有房，步行8分钟。

想：亚朵评分4.6，可以。接下来准备会议资料......

看到区别了吗？ReAct每一步都和真实世界交互 ------查日历发现有冲突，就调整时间；搜酒店发现满房，就换一家。不是先想好再做，而是做了才知道下一步该怎么想。

2.3 ReAct的优势和局限

优势：

能应对变化。 现实世界信息不断变化------航班取消、酒店满房、临时加会。ReAct每一步都基于最新信息决策，不怕"计划赶不上变化"
不需要一开始就掌握全部信息。 很多任务你不可能提前知道所有变量，ReAct允许你"做着做着搞清楚"
最像人的做事方式。 你自己处理复杂任务时，大概率也是边做边调整

局限：

容易"见树不见林"。 每一步只看眼前，可能缺乏全局规划。比如先订了最便宜的早班机，后来才发现酒店3点才能入住------早到了没地方去
效率不一定高。 一步一步串行推进，遇到需要并行处理的任务就慢了
可能陷入死循环。 如果两步之间互相依赖（酒店取决于航班时间，航班又想靠近酒店），Agent可能反复调整

一句话记住ReAct： 像一个经验丰富的侦探------到了现场先观察，发现线索就追，追到新线索再调整方向。适合信息不完整、情况会变化的任务。

三、Plan-and-Execute：先画蓝图，再分头干

3.1 什么是Plan-and-Execute

顾名思义，Plan-and-Execute就是"先规划，再执行"。

和CoT的区别在于：CoT想完了自己一步步做，Plan-and-Execute想完了拆成子任务，可以分头做。

如果说CoT是自己闷头干的"个人英雄"，Plan-and-Execute更像一个项目经理------先把大任务拆成小任务，分清先后和依赖关系，然后调度资源去执行，自己负责监控进度和协调。

装修房子就是典型的Plan-and-Execute：设计师先出整体方案和施工时间表，然后水电工、瓦工、油漆工按计划分头进场。设计师不用自己搬砖，但需要确保每个阶段按时完成、质量达标。

3.2 出差案例：Plan-and-Execute怎么做

同样是"帮我准备下周去北京出差三天"：

规划阶段（Planner）：

任务分解：

【日程确认】查日历，确定可用出差日期

【交通预订】搜索并预订机票/高铁（依赖任务1的日期结果）

【住宿预订】搜索并预订酒店（依赖任务2的到达时间）

【资料准备】整理会议所需文档和数据（与任务2、3并行）

【行程汇总】生成完整行程表（依赖任务1-4全部完成）

依赖关系：1 → 2 → 3，4可以和2、3同时进行，5最后做。

执行阶段（Executor）：

先执行任务1：查日历 → 确定周一至周三。

然后同时启动任务2（搜航班）和任务4（准备资料）。

任务2完成后启动任务3（订酒店）。

全部完成后执行任务5（汇总行程）。

监控阶段（Monitor）：

执行到任务3时发现酒店满房 → 通知Planner。

Planner重新规划任务3：扩大搜索范围到地铁3站以内。

Executor按新方案继续执行。

关键区别： Plan-and-Execute有明确的"规划"和"执行"分离。规划者只想不做，执行者只做不想，中间有监控者协调。而且子任务可以并行------同时订机票和准备资料，而不是一件做完再做下一件。

3.3 Plan-and-Execute的优势和局限

优势：

全局最优。 先看全貌再动手，避免"走一步算一步"导致的全局次优
可以并行。 不相互依赖的子任务同时推进，效率大幅提升。这在多Agent协作中尤其重要------一个Agent订机票，另一个同时准备资料
可控性强。 计划是透明的，你可以在执行前审核、修改计划

局限：

前期成本高。 需要先投入时间做规划，对于简单任务是"杀鸡用牛刀"
应对变化不够灵活。 虽然有监控和重新规划机制，但比ReAct的"随时调整"还是慢一拍
规划本身可能出错。 如果一开始的任务分解就有遗漏，后面执行再完美也白搭

一句话记住Plan-and-Execute： 像一个高效的项目经理------先画甘特图，再调度团队分头执行。适合大型、可拆解、需要协调多个子任务的场景。

四、同一个任务，三种模式的真实对比

概念讲完了，回到开头的出差案例，把三种模式放在一起对比。

4.1 执行过程对比

同一个"准备出差"任务，三种模式的执行节奏完全不同：

CoT：一大段纯思考，想完了才动手。结果到执行阶段才发现酒店满房------想得再完美也白搭。

ReAct：想和做交替推进，每一步都能及时发现问题并调整。但全程串行，一步一步来，最慢。

Plan-and-Execute：前期花时间规划，但拆完子任务后可以并行------订机票和准备资料同时进行。总耗时最短。

4.2 一张表看清差异

4.3 真实产品里怎么用

你可能好奇：现在市面上的Agent产品，用的是哪种模式？

答案是：混合使用。

专业Agent产品：

•Cursor写代码：典型的ReAct------读一段代码、想一下要改哪里、改了、运行一下看结果、不对再调整

•Manus做研究任务：Plan-and-Execute------接到"帮我调研XX行业"的任务后，先列出调研大纲，再一个个子课题去搜索、总结、汇总

•Devin写项目：也是Plan-and-Execute------先理解需求、设计方案，再拆成文件级别的子任务逐个实现

通用大模型：

•DeepSeek（深度思考模式）：开启后就是CoT------你能看到它一步步列出推理过程，尤其擅长数学和逻辑题。联网搜索时会切换到ReAct，边搜边分析

•豆包：日常对话用CoT快速回答；复杂任务会自动启用"深度思考"，展开更长的推理链；搜索联网时切换为ReAct模式

•通义千问：和豆包类似，基础问答是CoT，开启"深度思考"后推理链更长更透彻。它的"万相"等多模态工具则是ReAct------生成图片后检查效果、不满意再调整

•Claude（extended thinking）：本质就是CoT------在回答复杂问题前，先展开一大段内部推理，想清楚再给你答案

而且很多成熟的Agent会动态切换：简单问题用CoT快速推理，碰到需要搜索的就切ReAct，遇到大任务就启动Plan-and-Execute。就像一个老练的员工，不会所有事都用同一种方法处理。

五、怎么选：一张决策图

实际使用中，你不需要记住这些术语。但理解它们背后的逻辑，能帮你判断什么样的Agent适合什么样的任务。

简单记忆法：

•任务需要深度思考？ → CoT（比如：帮我分析这份财报、这个方案有没有漏洞）

•任务需要和外部交互、信息会变？ → ReAct（比如：帮我订机票、帮我调试这段代码）

•任务很大、可以拆成多个独立子任务？ → Plan-and-Execute（比如：帮我做一份完整的竞品报告、帮我组织一场活动）

当然，最好的Agent不让你选------它自己就知道什么时候该想、什么时候该做、什么时候该拆。 这也是Agent技术接下来进化的方向。

总结

回到开头的三个人：分析师（CoT）想得最透，侦探（ReAct）最能随机应变，项目经理（Plan-and-Execute）协调效率最高。

没有最好的思考模式，只有最合适的。 就像你自己------做决策时用分析思维，处理突发时凭经验灵活应对，管项目时用甘特图和分工表。

一句话带走：Agent的"聪明程度"不只取决于大模型多强，还取决于它用什么方式思考------CoT给它推理深度，ReAct给它适应能力，Plan-and-Execute给它协调效率。三者结合，才是真正聪明的Agent。

普通人如何抓住AI大模型的风口？

领取方式在文末

为什么要学习大模型？

目前AI大模型的技术岗位与能力培养随着人工智能技术的迅速发展和应用，大模型作为其中的重要组成部分，正逐渐成为推动人工智能发展的重要引擎。大模型以其强大的数据处理和模式识别能力，广泛应用于自然语言处理、计算机视觉、智能推荐等领域，为各行各业带来了革命性的改变和机遇。

目前，开源人工智能大模型已应用于医疗、政务、法律、汽车、娱乐、金融、互联网、教育、制造业、企业服务等多个场景，其中，应用于金融、企业服务、制造业和法律领域的大模型在本次调研中占比超过 30%。

随着AI大模型技术的迅速发展，相关岗位的需求也日益增加。大模型产业链催生了一批高薪新职业：

人工智能大潮已来，不加入就可能被淘汰。如果你是技术人，尤其是互联网从业者，现在就开始学习AI大模型技术，真的是给你的人生一个重要建议！

最后

只要你真心想学习AI大模型技术，这份精心整理的学习资料我愿意无偿分享给你，但是想学技术去乱搞的人别来找我！

在当前这个人工智能高速发展的时代，AI大模型正在深刻改变各行各业。我国对高水平AI人才的需求也日益增长，真正懂技术、能落地的人才依旧紧缺。我也希望通过这份资料，能够帮助更多有志于AI领域的朋友入门并深入学习。

真诚无偿分享！！！
vx扫描下方二维码即可
加上后会一个个给大家发

【附赠一节免费的直播讲座，技术大佬带你学习大模型的相关知识、学习思路、就业前景以及怎么结合当前的工作发展方向等，欢迎大家~】

大模型全套学习资料展示

自我们与MoPaaS魔泊云 合作以来，我们不断打磨课程体系与技术内容，在细节上精益求精，同时在技术层面也新增了许多前沿且实用的内容，力求为大家带来更系统、更实战、更落地的大模型学习体验。

希望这份系统、实用的大模型学习路径，能够帮助你从零入门，进阶到实战，真正掌握AI时代的核心技能！

01 教学内容

从零到精通完整闭环：【基础理论 →RAG开发 → Agent设计 → 模型微调与私有化部署调→热门技术】5大模块，内容比传统教材更贴近企业实战！
大量真实项目案例： 带你亲自上手搞数据清洗、模型调优这些硬核操作，把课本知识变成真本事‌！

02适学人群

应届毕业生‌： 无工作经验但想要系统学习AI大模型技术，期待通过实战项目掌握核心技术。

零基础转型‌： 非技术背景但关注AI应用场景，计划通过低代码工具实现"AI+行业"跨界‌。

业务赋能突破瓶颈： 传统开发者（Java/前端等）学习Transformer架构与LangChain框架，向AI全栈工程师转型‌。

vx扫描下方二维码即可

【附赠一节免费的直播讲座，技术大佬带你学习大模型的相关知识、学习思路、就业前景以及怎么结合当前的工作发展方向等，欢迎大家~】

本教程比较珍贵，仅限大家自行学习，不要传播！更严禁商用！

03 入门到进阶学习路线图

大模型学习路线图，整体分为5个大的阶段：

04 视频和书籍PDF合集

从0到掌握主流大模型技术视频教程（涵盖模型训练、微调、RAG、LangChain、Agent开发等实战方向）

新手必备的大模型学习PDF书单来了！全是硬核知识，帮你少走弯路（不吹牛，真有用）

05 行业报告+白皮书合集

收集70+报告与白皮书，了解行业最新动态！

06 90+份面试题/经验

AI大模型岗位面试经验总结（谁学技术不是为了赚$呢，找个好的岗位很重要）

07 deepseek部署包+技巧大全

由于篇幅有限

只展示部分资料

并且还在持续更新中...

真诚无偿分享！！！
vx扫描下方二维码即可
加上后会一个个给大家发

【附赠一节免费的直播讲座，技术大佬带你学习大模型的相关知识、学习思路、就业前景以及怎么结合当前的工作发展方向等，欢迎大家~】