一、面试题目
请详细描述 ReAct 框架的工作流程。在实际运行中,Reasoning(推理) 、Action(行动) 和 Observation(观察) 这三个环节是如何闭环协作的?它解决了大模型在处理复杂任务时的什么痛点?
二、知识储备
1. 核心背景:为什么要用 ReAct?
在 ReAct 出现之前,大模型要么只是"空想"(思维链 CoT,容易产生幻觉),要么只是"盲动"(单纯调用工具,缺乏逻辑)。 ReAct 的本质是: 让模型在行动之前先"思考",在行动之后根据"反馈"再思考,从而实现逻辑与动作的解耦。
2. 三步走协作流程
ReAct 的运行是一个 Loop(循环),直到目标达成或达到最大步数:
① 第 1 步:
Reasoning (Thought) ------ "谋定而后动" 模型基于当前问题或上一轮的结果,生成一段自然语言描述,分析当前的处境、缺失的信息以及下一步该做什么。
**作用:**减少幻觉,把复杂的任务拆解成可执行的小步骤。
② 第 2 步:
Action (Act) ------ "与世界交互" 模型决定调用哪个工具(Tool/Function)以及输入什么参数。这通常是输出一个特定的 JSON 或函数调用指令。
**作用:**让模型拥有"手",能够获取外部实时信息(如搜索、查库)。
③ 第 3 步:
Observation (Obs) ------ "看反馈结果" 执行工具后,将得到的结果(如搜索出的网页内容、数据库返回的数字)反馈给模型。
**作用:**为下一轮推理提供事实依据,将"外部知识"转化为"上下文"。
3. 代码视角(逻辑伪代码)
① 在 Python 中实现一个简单的 ReAct 循环,具体代码如下。
python
import asyncio
async def react_agent(goal: str):
# 初始化上下文:定义目标和可用工具
context = f"目标: {goal}\n可用工具: [搜索, 计算器]"
while True:
# 1. Reasoning + Action: 模型根据当前上下文生成"思考"和"动作"
# 提示词末尾强行拼接 "Thought:" 引导模型进入 ReAct 模式
response = await llm.generate(f"{context}\nThought: ")
# 检查是否达成最终目标
if "最终答案:" in response:
print("任务完成!")
return response
# 2. 执行 Action (解析模型输出并调用工具)
# 假设 parse_action 会从文本中提取出 {'tool': '...', 'query': '...'}
action = parse_action(response)
# 动态调用工具字典中的函数
# 例如: tools = {"搜索": search_func, "计算器": calc_func}
try:
observation = await tools[action['tool']](action['query'])
except Exception as e:
observation = f"错误: 执行工具失败 - {str(e)}"
# 3. Observation: 将执行结果(观察)拼接回上下文,开启下一轮推理循环
context += f"\n{response}\nObservation: {observation}"
# 打印当前轮次的状态(可选,方便调试)
print(f"--- 轮次观察: {observation} ---")
# 使用示例
# asyncio.run(react_agent("查询 2026 年世界杯举办地并计算场馆平均容纳人数"))
② 在 Node.js 中实现一个简单的 ReAct 循环,具体代码如下。
javascript
async function reactAgent(goal) {
let context = `目标: ${goal}\n可用工具: [搜索, 计算器]`;
while (true) {
// 1. Reasoning + Action: 模型输出 Thought 和 Action
const response = await llm.generate(context + "\nThought: ");
if (response.includes("最终答案:")) return response;
// 2. 执行 Action (模拟)
const action = parseAction(response); // 比如 { tool: "搜索", query: "2026天气" }
const result = await tools[action.tool](action.query);
// 3. Observation: 将结果拼接回上下文,开启下一轮循环
context += `${response}\nObservation: ${result}`;
}
}
4. ReAct 的核心优势
**① 可解释性:**开发者可以清晰看到模型的"心路历程",知道它为什么调用这个工具。
**② 错误纠正:**如果 Observation 返回了错误信息,模型可以在下一轮 Thought 中意识到错误并尝试换个方法。
三、破局之道
在回答完流程后,通过这段话展现你对 Agent 底层设计的思考:
回答 ReAct 框架,核心要理解它是在构建一套 "动态决策系统"。
你可以告诉面试官:ReAct 的伟大之处不在于它调用了工具,而在于它通过 Thought 强制模型在向量空间中进行自洽性检查,再通过 Observation 引入了外部世界的真实熵。它解决了 LLM 的 "闭环幻觉" 问题。在工程落地时,ReAct 就是 Agent 的逻辑神经系统,它让 AI 从一个 "只会聊天的文本框" 变成了一个 "能解决问题的数字员工"。