● ReAct vs Plan-and-Execute 详细对比 核心思想

一、核心思想

维度 ReAct Plan-and-Execute
全称 Reasoning + Acting Plan-and-Execute (也叫 Plan-then-Execute)
范式 交替进行推理和行动, 逐步决策 先生成完整计划, 再逐步执行
类比 边走边看的导航 先看地图规划路线, 再出发

二、工作流程对比

ReAct 循环

复制代码
Thought -> Action -> Observation -> Thought -> Action -> Observation -> ... -> Final Answer

每一步都根据上一步的观察结果, 重新推理下一步该做什么。没有全局计划, 完全是增量式决策。

Plan-and-Execute 循环

复制代码
阶段1:  Input -> Planner LLM -> [Step1, Step2, Step3, ...]
阶段2:  Step1 -> Executor -> Result1
        Step2 -> Executor -> Result2 (可根据 Result1 调整)
        ...
阶段3:  Results -> Final Answer

先由 Planner 生成结构化计划, 再由 Executor 逐步执行。执行过程中可选择性地 replan。


三、多维度对比

3.1 推理能力

维度 ReAct Plan-and-Execute
全局规划 弱。缺乏前瞻性, 易陷入局部最优 强。先全局思考再行动
适应性 强。每步都可根据新信息调整 中等。需要显式 replan 机制
推理深度 浅到中。每步推理负担小 计划阶段深, 执行阶段浅

3.2 Token 效率

维度 ReAct Plan-and-Execute
上下文消耗 高。每步都携带完整历史 低。Executor 只需当前步骤+必要上下文
总 token 量 随步数线性增长(累积 context) 计划阶段固定 + 执行阶段可控
长任务表现 差。容易撞 context window 上限 好。天然支持长链任务

这是 Plan-and-Execute 的最大优势之一: Executor 不需要看到所有历史, 只需要当前子任务的描述和必要输入。

3.3 错误处理

维度 ReAct Plan-and-Execute
错误恢复 自然。下一步 Thought 可以反思错误 需要 replan 机制, 否则会盲目执行错误计划
错误传播 低。每步独立决策 高。计划错误会连锁影响后续步骤
幻觉风险 中。每步都有观察校正 计划阶段较高(没有外部验证)

3.4 任务适用性

任务类型 更适合 原因
简单问答 / 单步检索 ReAct 计划开销不值得
探索性任务(不确定需要几步) ReAct 无法提前规划
多步确定性任务(数据管道、报告生成) Plan-and-Execute 步骤可预见, 计划价值高
长链任务(>10 步) Plan-and-Execute token 效率优势明显
需要并行执行的任务 Plan-and-Execute 计划可识别独立子任务并行化
交互式调试 ReAct 需要高频反馈循环

3.5 工程实现

维度 ReAct Plan-and-Execute
实现复杂度 低。单一 prompt loop 中高。需要 Planner + Executor + (可选) Replanner
可观测性 中。Thought 链可读但冗长 高。计划本身就是可审计的结构
可控性 低。难以干预中间决策 高。可以在执行前审核/修改计划
模型要求 需要较强的逐步推理能力 Planner 需强规划能力, Executor 可用较弱模型

四、混合架构(实践中最常见)

实际生产系统很少纯用一种, 常见的混合方式:

复制代码
+---------------------------------------------------+
|             Plan-and-Execute 外层                  ||                                                    |
|   Planner -> [Task1, Task2, Task3, ...]            ||                                                    |
|   +-------------------------------------------+   |
|   |   每个 Task 内部用 ReAct 执行              |   |
|   |   Thought -> Action -> Observation         |   |
|   |   -> Thought -> Action -> ...              |   |
|   +-------------------------------------------+   |
|                                                    |
|   执行完一个 Task 后 -> Replanner 评估             
|   -> 调整后续计划 -> 继续执行                      |
+---------------------------------------------------+

典型代表: LangGraph 的 Plan-and-Execute 模板、AutoGPT 后期版本。


五、选择决策树

复制代码
任务步骤 < 3 步?
  +-- 是 --> ReAct (计划开销不值得)
  +-- 否 --> 任务步骤可预见?
                +-- 是 --> Plan-and-Execute
                +-- 否 --> ReAct 或 混合架构
需要人工审核中间计划?
  +-- 是 --> Plan-and-Execute (计划天然可审计)
上下文窗口紧张?
  +-- 是 --> Plan-and-Execute (token 效率高)
任务高度不确定、需要频繁试错?
  +-- 是 --> ReAct

六、总结

结论 说明
ReAct 优势 灵活、简单、适应性强, 适合探索性和短链任务
P&E 优势 高效、可控、可审计, 适合确定性和长链任务
生产环境推荐 混合架构 -- 用 P&E 做顶层编排, ReAct 做子任务执行, 加 replan
相关推荐
冬奇Lab2 小时前
SubAgent 原理深度解析:AI 系统如何通过委托实现专业化分工
人工智能·agent·claude
奇舞精选2 小时前
写 HTML 就能做视频?HeyGen 开源的这个工具有点意思
html·agent
后端小肥肠3 小时前
我把自己蒸馏成小肥肠.skill,相关答疑全能做,一人公司终于能聚焦核心业务
人工智能·agent
Karl_wei5 小时前
你的AI 产品,需要尽快尝试 Agent
aigc·agent·ai编程
腾讯云开发者5 小时前
AI Agent企业落地:热情与现实的距离
agent
Cosolar6 小时前
🤷‍♂️ 憋了这么久的DeepSeek-V4:终究还是没拿到开源大模型榜一
llm·agent·deepseek
阿瑞说项目管理7 小时前
AI Agent 与普通 AI 助手的区别是什么?
大数据·人工智能·agent·智能体·企业级ai
_冷眸_7 小时前
Voyago:龙虾(OpenClaw)驱动的一站式旅行规划套件
人工智能·自然语言处理·aigc·agent·claude code
jiayong237 小时前
Hermes Agent 的 Skills、Plugins、Gateway 深度解析
ai·gateway·agent·hermes agent·hermes
Lands8 小时前
推荐一下配合agent开发的工具
设计模式·agent