
ReAct 范式 是 Re asoning(推理)+ Acting(行动)的缩写。
它是目前构建 AI Agent( 智能体 ) 最主流、最核心的模式。
简单来说,ReAct 就是让大模型学会**"一边思考,一边干活"** ,而不是像以前那样只会"闭门造车"。
1.🔄 核心公式:思考 + 行动 = 解决问题
在 ReAct 出现之前,大模型主要有两种状态:
-
纯推理 (Chain of Thought):
-
AI 在脑子里通过逻辑推导得出答案。
-
缺点:如果它不知道现在的天气,它只能瞎编(幻觉),因为它没法联网。
-
-
纯行动 (Action only):
-
AI 只是简单地调用工具。
-
缺点:缺乏规划,容易像无头苍蝇一样乱点按钮。
-
ReAct 将两者结合了起来: 它要求模型在执行每一个动作之前,先写下自己的思考(Thought) ;在执行动作后,观察结果(Observation),再决定下一步做什么。
2.🧬 ReAct 的"三步走"循环
ReAct 范式把解决一个复杂问题拆解成了无数个小的循环,每个循环包含三个步骤:
-
Thought (思考):
- AI 自言自语:"用户问我'现在纽约的天气怎么样?',所以我首先需要查找纽约的天气。"
-
Action (行动):
- AI 调用工具:
Search_Tool.run("Current weather in New York")
- AI 调用工具:
-
Observation (观察):
-
AI 看到工具返回的结果:"纽约现在晴天,25摄氏度。"
-
(然后进入下一个循环)
-
Thought:我拿到数据了,可以直接回答用户了。
-
Final Answer:纽约现在是晴天,25度。
-
3.🕵️♂️ 实战案例:谁是钢铁侠的扮演者的老婆?
假设你问 AI:"钢铁侠扮演者的老婆是谁?"(这是一个典型的多跳问题)。
-
普通 LLM:
- 可能会直接根据训练数据猜一个名字,或者如果数据太旧,它可能不知道。
-
ReAct Agent:
-
Thought 1:我需要先找出谁扮演了钢铁侠。
-
Action 1:搜索 "Iron Man actor"。
-
Observation 1:搜索结果显示是 "Robert Downey Jr."。
-
Thought 2:现在我知道是小罗伯特·唐尼了,我需要查他的老婆是谁。
-
Action 2:搜索 "Robert Downey Jr. wife"。
-
Observation 2:搜索结果显示是 "Susan Downey"。
-
Thought 3:我有答案了。
-
Final Answer:是苏珊·唐尼 (Susan Downey)。
-
4.🚀 为什么 ReAct 这么重要?
ReAct 是 AI 从"聊天机器人"进化为"办事员"的关键技术:
-
减少幻觉:
- 因为每一步都有
Observation(真实世界的反馈)作为支撑,AI 不再需要瞎编。如果搜索不到,它会说"我搜不到"。
- 因为每一步都有
-
实时性:
- 通过 Action 调用搜索工具,AI 可以获取此时此刻的最新信息。
-
可解释性:
- 你可以看到 AI 的
Thought日志,清楚地知道它是怎么一步步推导出答案的,而不是一个黑盒。
- 你可以看到 AI 的
总结
ReAct 范式 就是给大模型装上了**"手"(工具)** 和**"眼睛"(观察)** ,并教会它一套**"做事的逻辑"** 。
它是目前所有主流 Agent 框架(如 LangChain, AutoGPT)背后的底层逻辑。