ReAct 将 Reasoning 与 Acting 放进同一个循环。 模型不再只靠已有知识直接作答,而是先判断下一步,再调用搜索、数据库、计算器或其他工具,用真实结果继续推进任务。
01. ReAct 是什么
ReAct 的名字来自 Reasoning + Acting。它不是某个特定模型,而是一种组织大模型完成任务的框架。
普通问答往往只有"输入问题---生成答案"两步。ReAct 在中间加入工具交互:模型可以搜索资料、查询数据库、执行代码或操作环境,然后根据返回结果继续判断。整个任务由多轮"思考---行动---观察"组成。

02. 为什么需要 ReAct
Chain-of-Thought(CoT) 擅长把复杂问题拆开,但它仍主要依赖模型内部知识。遇到最新信息、陌生事实或精确计算时,一旦前面某一步猜错,错误可能沿着整条推理链继续传播。
只执行工具调用的 Act 又存在另一个问题:系统会行动,却不一定知道为什么要这样行动,也不容易把一个复杂目标拆成多个子目标。
ReAct 把两者结合起来:推理负责决定"下一步查什么、做什么",工具负责提供真实反馈,观察结果再反过来修正推理。
03. 核心工作循环

循环会持续到模型获得足够信息,或者达到预设的停止条件。最后一步通常是 Final Answer,即面向用户整理后的答案。
04. 一个直观示例
假设用户提出:"查出某篇论文的发表年份,再计算它距 2026 年有多少年。"模型不能只靠记忆,需要先检索,再计算。
Thought 1:我需要先确认论文的准确发表年份。
Action 1:Search[论文标题]
Observation 1:检索结果显示论文发表于 2022 年。
Thought 2:现在可以计算 2026 - 2022。
Action 2:Calculator[2026 - 2022]
Observation 2:4
Final Answer:该论文发表于 2022 年,距 2026 年为 4 年。
这里的关键不是格式本身,而是信息流:每个 Action 都由当前 Reasoning 决定,每个 Observation 又会改变下一步 Reasoning。
05. ReAct Prompt 怎么写
一个可用的 ReAct Prompt 至少需要说明四件事:任务目标、可用工具、工具调用格式和结束条件。
你需要解决用户的问题,并在必要时使用工具。
可用工具:
- Search[query]:搜索外部资料
- Calculator[expression]:执行数学计算
工作规则:
1. 先判断当前缺少什么信息。
2. 需要外部信息时,选择一个工具并给出准确参数。
3. 根据 Observation 决定下一步。
4. 信息充分后,输出 Final Answer。
5. 不要编造工具结果。
输出格式:
Action: 工具名[参数]
Observation: 工具返回结果
Final Answer: 面向用户的最终答案
论文中的经典 ReAct 通常会加入若干 Few-shot examples ,让模型模仿完整轨迹。现代 Agent 系统则常通过 Function Calling 或结构化工具接口约束 Action,不必完全依赖自由文本格式。
06. ReAct、CoT 与 Act 的区别
| 方法 | 主要能力 | 外部工具 | 典型问题 |
|---|---|---|---|
| CoT | 分解问题并进行多步推理 | 通常不使用 | 可能依赖错误记忆,产生事实幻觉 |
| Act | 根据指令连续执行操作 | 使用 | 缺少任务分解,容易出现无目的调用 |
| ReAct | 推理、行动与反馈交替进行 | 使用 | 效果受工具质量和上下文长度影响 |