关于ReAct Agent的实践

什么是ReAct Agent

ReAct是一种结合推理(Reasoning)和行动(Act)推理模式,旨在让大模型在解决问题时结合已有信息来进行逻辑推理并作出行动。说直白点,其实就是通过提示词来模拟人的思考方式:思考-行动-观测,即先思考需要什么动作,然后执行动作,观测动作产生的结果是否能够解决用户问题,若不能则继续进行思考-行动-观测。

ReAct的核心思想

以上是论文中关于ReAct推理模式的一个循环过程的截图,用户输入问题后,ReAct会通过"思考-行动-观测"这样的循环过程来解决用户问题

  1. 思考(thought):根据当前任务目标和上下文(包括之前思考观测到的结果),大模型会思考当前观测到的结果是否解决用户问题,若没解决会继续思考下一步需要如何做;若已解决,则结束整个循环过程;
  2. 行动(Act):指大模型基于本次思考,选择需要执行的操作或者工具;
  3. 观察(Observation):执行操作或者工具得到的结果,大模型会根据观察到的结果思考下一步。

ReAct Agent实践

prompt定义

  1. 角色定义:明确任务的目标和要求;
  2. 工具列表:列出可用的工具及对应的参数;
  3. 工具格式:工具中各个字段的含义;
  4. 示例:提供样例,帮助模型理解任务。
js 复制代码
Answer the following questions as best you can. You have access to the following tools:

{tools}

Use the following format:

Question: the input question you must answer
Thought: you should always think about what to do
Action: the action to take, should be one of [{tool_names}]
Action Input: the input to the action
Observation: the result of the action
... (this Thought/Action/Action Input/Observation can repeat N times)
Thought: I now know the final answer
Final Answer: the final answer to the original input question

Begin!

Question: {input}
Thought:{agent_scratchpad}
  • 从示例中能看出来,当模型输出Final Answer,表明推理过程结束,模型已经拿到最终答案;

ReAct存在的问题

无限循环

从ReAct的推理模式来看,如果观测到的结果不符合用户提问,大模型会一直按照思考、行动、观察的流程无限循环下去。因此,我们需要从工程链路上规避这个问题,解决方法:

  1. 设置最大迭代次数,超过则中断循环过程;

推理过程复杂

相比较于function calling,仅需调用一次LLM,ReAct需要多次调用LLM,才能完成一个任务。而在很多场景中,我们无需使用ReAct这种复杂的推理过程,例如用户一次提问,仅需调用单工具(我想查询下会员信息),这种使用function calling更合适。

  1. 多步推理:复杂的任务可能需要多次推理和行动,增加了推理的复杂性。
  2. 错误累积:每次推理和行动都可能引入错误,这些错误可能会累积,导致最终结果不准确

无法提前生成计划

  1. 动态决策:ReAct代理通常需要在每一步进行动态决策,难以提前生成完整的行动计划,只能边执行边生成计划。
  2. 依赖上下文:每个步骤的决策高度依赖于当前的上下文和观测结果,使得提前规划变得困难。

ReAct适合的场景

  • 适合问题解决方案路径不明确,需要通过大模型已有知识和先验知识来实现解决方法的泛化性,迭代尝试和调整来找到答案。
相关推荐
北巷`7 分钟前
CC Workflow Studio 解析与落地方案
人工智能·团队开发
十铭忘8 分钟前
连续扩散语言模型
人工智能
AI算法沐枫11 分钟前
深度学习python代码处理科研测序数据
数据结构·人工智能·python·深度学习·决策树·机器学习·线性回归
迁移科技13 分钟前
告别人工分拣!迁移科技 AI+3D 视觉让机器人 “看懂” 无序抓取
人工智能·科技·3d·机器人·自动化·视觉检测
IT_陈寒30 分钟前
Redis缓存击穿把我整不会了,原来还有这手操作
前端·人工智能·后端
YuanDaima204835 分钟前
Linux 进阶运维与 AI 环境实战:进程管理、网络排错与 GPU 监控
linux·运维·服务器·网络·人工智能
跨境数据猎手44 分钟前
跨境商城反向海淘系统开发全流程逻辑(上)
人工智能·爬虫·系统架构
听你说321 小时前
丈八科技与浪潮海若达成战略合作:共建人工智能产测一体化超级工厂
人工智能·科技
初心未改HD1 小时前
深度学习之Attention注意力机制详解
人工智能·深度学习
kyriewen1 小时前
面试官让我查各部门工资最高的员工,我用AI三秒写出窗口函数,他愣了
后端·mysql·面试