Agent-自我反思机制

之前我们提到过,在ReAct中,agent会在输出结果后先观察结果,判断是否符合人物标准,不符合就重新进行一轮操作,直到输出令agent满意的答案为止,关于这个反思机制,具体的如下。

自我反思机制

自我反思机制分为三个阶段:

  1. 原始输出:模型生成初步回答,不施加过多限制,提供基础材料。类似人类写作的第一稿,目的是"有东西可改"。

  2. 反思与评估:模型扮演"批判者"角色,检查第一轮输出,评估事实准确性(检查回答中是否包含明显的事实错误,数据是否准确,引用是否恰当)、逻辑连贯性(评估推理过程是否存在漏洞,论证是否合理,结论是否从前提自然得出)、结构合理性(检查是否遗漏了关键步骤、边界条件或重要信息,内容是否全面)和格式与表达(评估输出格式是否符合要求,是否条理清晰而非冗长段落)。

  3. 修改与重写:基于反思结果,模型生成更完善的回答,修正错误,优化结构,补充细节,提升整体质量。

这种反思架构是为了避免agent在输出过程中,因为判断失误,局部数据引导方向错误或者幻觉等等,使得结果可能包含事实错误,推理过程存在逻辑漏洞,输出格式乱序无法阅读和理解等。且就算回答接近完美,也可能存在优化空间,agent可以通过这个机制迭代优化,是输出不仅仅是天才式地一点就通,而是形成一个成熟的方案或结果。

反思机制的架构,是让一个agent作为回答者,另一个作为批判者,这样分离开两种功能,就能在提示词设计上,让前者尽可能地偏向于试探各种方向,以免漏过最佳方案,具体是否可行以及可能的漏洞就交给另一个agent去检查,也就相当于在每轮思考中强行加多一次保证和优化。更关键的是,这样分离职能,还可以让我们为这两个角色选取不同的LLM,也能进一步避免因为同一种训练方式,参数差不多,导致批判者认同前一个回答者的漏洞而忽略。

相关推荐
runnerdancer8 分钟前
Agent如何加载执行Skill的脚本
前端·agent
nuIl1 小时前
实现一个 Coding Agent(7):Skills
前端·agent·cursor
nuIl1 小时前
实现一个 Coding Agent(8):会话持久化与多会话
前端·agent·cursor
沉默王二4 小时前
面试结束后,我反问:“就面个实习至于上这么大强度吗?”面试官:“你对 RAG、Agent、MCP、Skill 理解得很到位,所以要求高一点。”
面试·agent·ai编程
怕浪猫5 小时前
第一章:AI Agent概览:开启智能体时代
aigc·agent·ai编程
JouYY6 小时前
简单聊一下Harness层中的人机协同(HITL)
前端框架·llm·agent
leeyi6 小时前
Multi-Agent:让多个 AI 分工协作完成复杂任务
后端·aigc·agent
混沌福王6 小时前
Electron三端统一架构:运行时Adapter、IPC能力边界与分层设计
人工智能·agent·ai编程
AINative软件工程6 小时前
LLM 应用的 Bad Case 反馈闭环工程:别再把用户差评丢进客服表了
llm·openai·agent
HjhIron7 小时前
🤖 一文搞懂 AI Agent 核心概念:从 LLM 到 Tools,手写一个“股票查询 Agent”
agent