【LLM-Agent】ReWOO模式和ReAct的区别

note

  • REWOO的缺陷在于,非常依赖于Planner的规划能力,如果规划有误,则后续所有的执行都会出现错误。尤其是对于复杂任务,很难在初始阶段就制定合理且完备的计划清单。因此,如果要提升Agent的准确率,需要有规划调整机制,即在执行的过程中,根据环境反馈,不断调整计划。
  • ReWOO其实就是Plan-and-execute agents

文章目录

一、rewoo模式

论文:《ReWOO: Decoupling Reasoning from Observations for Efficient Augmented Language Models》

ReWOO 的工作流程包括三个主要部分:

计划者(Planner):将任务分解并制定包含多个相互关联计划的蓝图,每个计划都分配给工作者执行。

工作者(Worker):根据计划者提供的蓝图,使用外部工具获取真实证据。

求解器(Solver):将所有计划和证据结合起来,形成对原始任务的最终解决方案。

二、创新点

ReWOO 的创新点主要包括以下几个方面:

分离推理与观察:ReWOO 将推理过程与使用外部工具的过程分开,避免了在依赖观察的推理中反复提示的冗余问题,从而大幅减少了 Token 的消耗。

模块化设计:ReWOO 使用模块化框架,通过计划者、工作者和求解器的分工合作,提高了系统的扩展性和效率。

效率提升:实验结果表明,这种方法不仅提升了准确率,还显著降低了令牌消耗。

工具调用的鲁棒性:ReWOO 在工具失效的情况下表现出更高的鲁棒性,这意味着即使某些工具无法返回有效证据,ReWOO 仍能通过合理的计划生成和证据整合,提供有效的解决方案。

左侧是ReAct方法,当User输入Task后,把上下文Context和可能的样本Example输入到LLM中,LLM会调用一个目标工具Tool,从而产生想法Thought,行动Action,观察Observation。由于拆解后的下一次循环也需要调用LLM,又会调用新的工具Tool,产生新的Thought,Action,Observation。如果这个步骤变得很长,就会导致巨大的重复计算和开销。

右侧ReWOO的方法,计划器Planner把任务进行分解,分解的依据是它们内部哪些用同类Tool,就把它分成同一类。在最开始,依旧是User输入Task,模型把上下文Context和Examplar进行输入。这里与先前有所不同的是,输入到Planner中,进行分解,然后调用各自的工具Tool。在得到了所有的Tool的输出后,生成计划结果Plan和线索,放到Solver进行总结,然后生成回答。这个过程只调用了两次LLM。

举个栗子:假设你是一个侦探,需要解决一个谜题:找出谁在图书馆偷了一本珍贵的书。

ReAct模式的类比:

在ReAct模式下,你的思考和行动过程可能是这样的:

你首先想到去图书馆询问管理员(行动)。

管理员告诉你,昨天有一个穿着蓝色衣服的人来过(观察)。

然后你决定去查看图书馆的监控录像(行动)。

你发现录像中确实有一个穿蓝色衣服的人(观察)。

接下来,你决定去询问图书馆的常客,看看他们是否认识这个人(行动)。

常客告诉你,这个人可能是附近的学生(观察)。

最后,你决定去学校调查,最终找到了嫌疑人(行动)。

在ReAct模式中,你的每一步都是基于前一步的观察结果来决定的,这是一个逐步的、迭代的过程。

ReWOO模式的类比:

在ReWOO模式下,你的思考和行动过程可能是这样的:

你首先规划了整个调查过程:

询问图书馆管理员

查看监控录像

询问图书馆常客

去学校调查

然后,你同时(并发)执行所有这些行动:

派助手去询问管理员

自己去查看监控录像

同时,另一个助手去询问常客

最后,你亲自去学校调查

所有行动完成后,你收集所有信息,综合分析,最终找到嫌疑人。

1\] [AI大模型实战 \| AI Agent设计模式 - REWOO,优化ReAct冗余问题](https://blog.csdn.net/Androiddddd/article/details/143058887) \[2\] [LLM Agent设计模式 - ReWOO](https://zhuanlan.zhihu.com/p/713903240) \[3\] LLM Agent设计模式 - ReWOO:https://www.yidoo.xyz/llm-agent-design-pattern-rewoo \[4\] 《ReWOO: Decoupling Reasoning from Observations for Efficient Augmented Language Models》 \[5\] [On short of "ReWOO: Decoupling Reasoning from Observations for Efficient Augmented Language Models"](https://medium.com/@minhle_0210/on-short-of-rewoo-decoupling-reasoning-from-observations-for-efficient-augmented-language-models-151f53f09630)

相关推荐
胡攀峰3 小时前
第12章 微调生成模型
人工智能·大模型·llm·sft·强化学习·rlhf·指令微调
古希腊掌管学习的神7 小时前
[LangGraph教程]LangGraph04——支持人机协作的聊天机器人
人工智能·语言模型·chatgpt·机器人·agent
文慧的科技江湖14 小时前
图文结合 - 光伏系统产品设计PRD文档 -(慧哥)慧知开源充电桩平台
人工智能·开源·储能·训练·光伏·推理
HuggingFace14 小时前
大模型评估排障指南 | 关于推理
大模型
dundunmm14 小时前
【每天一个知识点】如何解决大模型幻觉(hallucination)问题?
人工智能·数据挖掘·大模型
MonkeyKing_sunyuhua15 小时前
4.4 记忆机制与上下文管理:短期与长期记忆的设计与应用
大数据·人工智能·agent
AI蜗牛车15 小时前
【LLM+Code】Github Copilot Agent/VsCode Agent 模式Prompt&Tools详细解读
人工智能·语言模型·github·copilot·agent
测试老吴20 小时前
Dify升级-linux环境下使用zip离线安装方式部署升级
大模型·dify·测试应用
亚里随笔2 天前
TORL:解锁大模型推理新境界,强化学习与工具融合的创新变革
人工智能·llm·agent·agentic rl
AI大模型顾潇2 天前
[特殊字符] 大模型对话风格微调项目实战——模型篇 [特殊字符]✨
人工智能·算法·机器学习·数据挖掘·大模型·微调·ai大模型