【AI面试临阵磨枪】ReAct 框架完整流程是什么?Reasoning → Action → Observation 如何协作?

一、面试题目

请详细描述 ReAct 框架的工作流程。在实际运行中,Reasoning(推理)Action(行动)Observation(观察) 这三个环节是如何闭环协作的?它解决了大模型在处理复杂任务时的什么痛点?

二、知识储备

1. 核心背景:为什么要用 ReAct?

在 ReAct 出现之前,大模型要么只是"空想"(思维链 CoT,容易产生幻觉),要么只是"盲动"(单纯调用工具,缺乏逻辑)。 ReAct 的本质是: 让模型在行动之前先"思考",在行动之后根据"反馈"再思考,从而实现逻辑与动作的解耦。

2. 三步走协作流程

ReAct 的运行是一个 Loop(循环),直到目标达成或达到最大步数:

① 第 1 步:

Reasoning (Thought) ------ "谋定而后动" 模型基于当前问题或上一轮的结果,生成一段自然语言描述,分析当前的处境、缺失的信息以及下一步该做什么。

**作用:**减少幻觉,把复杂的任务拆解成可执行的小步骤。

② 第 2 步:

Action (Act) ------ "与世界交互" 模型决定调用哪个工具(Tool/Function)以及输入什么参数。这通常是输出一个特定的 JSON 或函数调用指令。

**作用:**让模型拥有"手",能够获取外部实时信息(如搜索、查库)。

③ 第 3 步:

Observation (Obs) ------ "看反馈结果" 执行工具后,将得到的结果(如搜索出的网页内容、数据库返回的数字)反馈给模型。

**作用:**为下一轮推理提供事实依据,将"外部知识"转化为"上下文"。

3. 代码视角(逻辑伪代码)

① 在 Python 中实现一个简单的 ReAct 循环,具体代码如下。

python 复制代码
import asyncio

async def react_agent(goal: str):
    # 初始化上下文:定义目标和可用工具
    context = f"目标: {goal}\n可用工具: [搜索, 计算器]"

    while True:
        # 1. Reasoning + Action: 模型根据当前上下文生成"思考"和"动作"
        # 提示词末尾强行拼接 "Thought:" 引导模型进入 ReAct 模式
        response = await llm.generate(f"{context}\nThought: ")

        # 检查是否达成最终目标
        if "最终答案:" in response:
            print("任务完成!")
            return response

        # 2. 执行 Action (解析模型输出并调用工具)
        # 假设 parse_action 会从文本中提取出 {'tool': '...', 'query': '...'}
        action = parse_action(response)

        # 动态调用工具字典中的函数
        # 例如: tools = {"搜索": search_func, "计算器": calc_func}
        try:
            observation = await tools[action['tool']](action['query'])
        except Exception as e:
            observation = f"错误: 执行工具失败 - {str(e)}"

        # 3. Observation: 将执行结果(观察)拼接回上下文,开启下一轮推理循环
        context += f"\n{response}\nObservation: {observation}"

        # 打印当前轮次的状态(可选,方便调试)
        print(f"--- 轮次观察: {observation} ---")

# 使用示例
# asyncio.run(react_agent("查询 2026 年世界杯举办地并计算场馆平均容纳人数"))

② 在 Node.js 中实现一个简单的 ReAct 循环,具体代码如下。

javascript 复制代码
async function reactAgent(goal) {
  let context = `目标: ${goal}\n可用工具: [搜索, 计算器]`;

  while (true) {
    // 1. Reasoning + Action: 模型输出 Thought 和 Action
    const response = await llm.generate(context + "\nThought: ");

    if (response.includes("最终答案:")) return response;

    // 2. 执行 Action (模拟)
    const action = parseAction(response); // 比如 { tool: "搜索", query: "2026天气" }
    const result = await tools[action.tool](action.query);

    // 3. Observation: 将结果拼接回上下文,开启下一轮循环
    context += `${response}\nObservation: ${result}`;
  }
}

4. ReAct 的核心优势

**① 可解释性:**开发者可以清晰看到模型的"心路历程",知道它为什么调用这个工具。

**② 错误纠正:**如果 Observation 返回了错误信息,模型可以在下一轮 Thought 中意识到错误并尝试换个方法。

三、破局之道

在回答完流程后,通过这段话展现你对 Agent 底层设计的思考:

回答 ReAct 框架,核心要理解它是在构建一套 "动态决策系统"

你可以告诉面试官:ReAct 的伟大之处不在于它调用了工具,而在于它通过 Thought 强制模型在向量空间中进行自洽性检查,再通过 Observation 引入了外部世界的真实熵。它解决了 LLM 的 "闭环幻觉" 问题。在工程落地时,ReAct 就是 Agent 的逻辑神经系统,它让 AI 从一个 "只会聊天的文本框" 变成了一个 "能解决问题的数字员工"。

相关推荐
Raink老师5 小时前
【AI面试临阵磨枪-79】实时数据 RAG:订单、商家、物流、天气、动态库存
人工智能·面试·职场和发展
脑极体5 小时前
点亮星河AI+鸿蒙,一座艺术场馆的日神觉醒
人工智能·华为·harmonyos
Cosolar5 小时前
Chroma向量库面试学习指南
数据库·人工智能·面试·职场和发展·数据库架构
BUG指挥官5 小时前
Claude Code的自动化编程
人工智能
意图共鸣6 小时前
意图共鸣科技《认知智能白皮书》——感知与执行分离:认知架构(CA)如何重塑大模型底层结构
人工智能·架构
等一个人的@6 小时前
让数据自己开口:数睿通智库新增智能问数模块
人工智能·自然语言处理
ZGi.ai6 小时前
人工审查节点:让自动化工作流多一步人工把关
运维·人工智能·自动化·人机协同·智能体工作流·人工审查
王莎莎-MinerU6 小时前
MinerU 深度技术解析:从架构原理到生产部署的全面指南
css·人工智能·自然语言处理·架构·ocr·个人开发
盘古信息IMS6 小时前
盘古信息IMS V6 8.0重磅发布:以薪火AI数智平台点燃离散制造数智化引擎
大数据·人工智能·制造
weilaieqi16 小时前
从音响制造到AI家庭娱乐生态:不见不散AI智能K歌音响亮相第二十届深圳国际金融博览会
人工智能·制造·娱乐