关于ReAct Agent的实践

什么是ReAct Agent

ReAct是一种结合推理(Reasoning)和行动(Act)推理模式,旨在让大模型在解决问题时结合已有信息来进行逻辑推理并作出行动。说直白点,其实就是通过提示词来模拟人的思考方式:思考-行动-观测,即先思考需要什么动作,然后执行动作,观测动作产生的结果是否能够解决用户问题,若不能则继续进行思考-行动-观测。

ReAct的核心思想

以上是论文中关于ReAct推理模式的一个循环过程的截图,用户输入问题后,ReAct会通过"思考-行动-观测"这样的循环过程来解决用户问题

  1. 思考(thought):根据当前任务目标和上下文(包括之前思考观测到的结果),大模型会思考当前观测到的结果是否解决用户问题,若没解决会继续思考下一步需要如何做;若已解决,则结束整个循环过程;
  2. 行动(Act):指大模型基于本次思考,选择需要执行的操作或者工具;
  3. 观察(Observation):执行操作或者工具得到的结果,大模型会根据观察到的结果思考下一步。

ReAct Agent实践

prompt定义

  1. 角色定义:明确任务的目标和要求;
  2. 工具列表:列出可用的工具及对应的参数;
  3. 工具格式:工具中各个字段的含义;
  4. 示例:提供样例,帮助模型理解任务。
js 复制代码
Answer the following questions as best you can. You have access to the following tools:

{tools}

Use the following format:

Question: the input question you must answer
Thought: you should always think about what to do
Action: the action to take, should be one of [{tool_names}]
Action Input: the input to the action
Observation: the result of the action
... (this Thought/Action/Action Input/Observation can repeat N times)
Thought: I now know the final answer
Final Answer: the final answer to the original input question

Begin!

Question: {input}
Thought:{agent_scratchpad}
  • 从示例中能看出来,当模型输出Final Answer,表明推理过程结束,模型已经拿到最终答案;

ReAct存在的问题

无限循环

从ReAct的推理模式来看,如果观测到的结果不符合用户提问,大模型会一直按照思考、行动、观察的流程无限循环下去。因此,我们需要从工程链路上规避这个问题,解决方法:

  1. 设置最大迭代次数,超过则中断循环过程;

推理过程复杂

相比较于function calling,仅需调用一次LLM,ReAct需要多次调用LLM,才能完成一个任务。而在很多场景中,我们无需使用ReAct这种复杂的推理过程,例如用户一次提问,仅需调用单工具(我想查询下会员信息),这种使用function calling更合适。

  1. 多步推理:复杂的任务可能需要多次推理和行动,增加了推理的复杂性。
  2. 错误累积:每次推理和行动都可能引入错误,这些错误可能会累积,导致最终结果不准确

无法提前生成计划

  1. 动态决策:ReAct代理通常需要在每一步进行动态决策,难以提前生成完整的行动计划,只能边执行边生成计划。
  2. 依赖上下文:每个步骤的决策高度依赖于当前的上下文和观测结果,使得提前规划变得困难。

ReAct适合的场景

  • 适合问题解决方案路径不明确,需要通过大模型已有知识和先验知识来实现解决方法的泛化性,迭代尝试和调整来找到答案。
相关推荐
一只帆記3 分钟前
SpringBoot EhCache 缓存
spring boot·后端·缓存
AWS官方合作商2 小时前
Amazon Augmented AI:人类智慧与AI协作,破解机器学习审核难题
人工智能·机器学习·aws
yuren_xia3 小时前
Spring Boot中保存前端上传的图片
前端·spring boot·后端
JohnYan6 小时前
Bun技术评估 - 04 HTTP Client
javascript·后端·bun
shangjg36 小时前
Kafka 的 ISR 机制深度解析:保障数据可靠性的核心防线
java·后端·kafka
青莳吖7 小时前
使用 SseEmitter 实现 Spring Boot 后端的流式传输和前端的数据接收
前端·spring boot·后端
人工智能小豪7 小时前
2025年大模型平台落地实践研究报告|附75页PDF文件下载
大数据·人工智能·transformer·anythingllm·ollama·大模型应用
芯盾时代7 小时前
AI在网络安全领域的应用现状和实践
人工智能·安全·web安全·网络安全
黑鹿0228 小时前
机器学习基础(三) 逻辑回归
人工智能·机器学习·逻辑回归
我的golang之路果然有问题8 小时前
ElasticSearch+Gin+Gorm简单示例
大数据·开发语言·后端·elasticsearch·搜索引擎·golang·gin