通过 Spring AI Alibaba 源码,看如何玩转 ReAct 智能体范式

希望通过本文的分析,帮助大家跳出 API 的表面使用,从运行机制和架构设计的角度理解 ReAct Agent 的本质。

核心前置知识

从"只会聊天"到"学会行动"

以前的大模型,更像是个"纸上谈兵的军师"。你问它什么,它都能陪你聊上三天三夜,可一旦涉及查实时天气、调内部接口、改数据库,它就抓瞎了------因为这时候的它,只会聊天。而 ReAct 模式(Reasoning + Acting,推理+行动),就是教大模型学会行动的绝妙招式。它通过一套"思考 →\rightarrow → 行动 →\rightarrow → 观察"的闭环控制流,让大模型在遇到不懂的问题时,能主动停下来去"翻书"或"搬救兵"(调用工具)。

ReAct Agent 的底层运行图

从运行机制来看,一个 Agent 的底层运行模型,本质上是一张 Graph。

什么是Graph(图)

在计算机科学中,Graph(图)是一种用于描述节点之间关系的数据结构。

它由两部分组成:

Node(节点) Edge(边)

其中,节点表示一个实体,边表示实体之间的连接关系。(其实就是流程图)

例如一个简单的审批流程:

这里:

每一个审批步骤都是一个节点; 节点之间的流转路径就是边; 整个审批过程构成了一张图。

Graph在React Agent中的工作流程

React模式我们可以用以下流程图表示出

  1. 将用户内容发送给LLM,同时告诉LLM,可以使用的TOOL
  2. LLM进行推理分析,返回结果
  3. 判断是否需要调用TOOL
  • 如果不需要调用,则结束
  • 如果需要调用则进行调用,将调用结果再返回给LLM,供LLM进行下一次思考(返回到了2)

SpringAI alibaba 核心源码学习

官方使用教程:java2ai.com/

流程概览

我们先通过以下代码输出alibaba,为ReactAGent编排的工作流

java 复制代码
  this.chatModel = DashScopeChatModel.builder().dashScopeApi(dashScopeApi).build();
        ReactAgent translatorAgent = ReactAgent.builder()
                .name("translator_agent")
                .model(chatModel)
                .tools(new DateTimeTools())
                .description("擅长将文章翻译成各种语言")
                .instruction("你是一个专业的翻译家,能够准确地将文章翻译成目标语言。")
                .outputKey("translator_output")
                .build();


        GraphRepresentation graph = translatorAgent.getAndCompileGraph().stateGraph.getGraph(GraphRepresentation.Type.PLANTUML);
        System.out.println(graph.content());

将输出的PlantUML转换成流程图后,可以清楚的看到alibaba对ReactAgent设置的Graph

  • InstructionAgentHook: 内置的钩子(先不管)
  • Agent_Model:调用LLM
  • check_state:判断要不要调用tool
  • Agent_tool:调用tool

钩子

钩子其实就是面向切面的思想,可大致分为两类,一类是在调用LLM节点前后执行。另一类是在这个Agent执行前后执行。

initGraph

代码位置: com.alibaba.cloud.ai.graph.agent.ReactAgent#initGraph

执行时机:

当ReactAgent第一次被调用时,会执行initGraph初始化Graph,React的核心流程也在这里完成

核心代码

  • 将调用LLM节点转换成一个Node并加入到Graph
  • 判断是否有工具,如果有将工具节点加入到Graph
  • 获取所有钩子
  • 把钩子转换为节点并添加到流程图中
  • 添加边(给流程图连线)
  • start节点连第一个节点(entryNode)
  • 把所有钩子都连上线

工具边的处理 当判断该Agent有tool时调用setupToolRouting

代码位置 com.alibaba.cloud.ai.graph.agent.ReactAgent #setupToolRouting

这两行代码添加了两个条件节点,是实现Tool Calling的核心代码

也就是添加了这两个被框出来的条件边

第一个边是,处理LLM返回消息到程序,判断是该结束,还是该调工具 第二个边是,处理拿到工具执行结果后该结束还是该返回LLM节点,继续思考

makeModelToTools关键代码

如果没有tool调用就结束,有就进工具节点

makeToolsToModelEdge关键代码

如果调用完工具后不需要再经LLM了,则直接end,否则回到LLM调用节点

结尾

ReAct Agent 本质上就是一个由 LLM 驱动的动态工作流(Workflow)。

通过对 ReAct Agent 关键源码的剖析,从运行机制上看,ReAct Agent 本质上是一套基于 Graph 的工作流系统, 所谓的 ReAct(Reason + Act),实际上就是让大模型在工作流中不断完成「思考 → 行动 → 观察 → 再思考」的循环,直到任务结束。

技术迭代的速度每天都在加快,但底层设计的艺术往往历久弥新。欢迎在评论区留言,我们一起"点亮"更多硬核技术栈!

相关推荐
卡梅德生物科技小能手1 小时前
卡梅德生物科普CD124(IL-4Rα):2型免疫炎症的核心调控靶点
人工智能·经验分享·深度学习
垂钓的小鱼11 小时前
TRIZ理论是什么?萃智引擎如何将它变为工程师的AI创新助手
人工智能·microsoft
咋吃都不胖lyh1 小时前
DBSCAN(基于密度的空间聚类应用与噪声)算法
人工智能·机器学习
诸葛务农1 小时前
涡喷式发烟机施放粉末状烟剂成烟面积的计算:烟剂材料特性的影响
人工智能
星浩AI1 小时前
合规项目大模型如何部署?硬件选型 + vLLM/LMDeploy 实战
pytorch·后端·llm
云烟成雨TD2 小时前
Agent Scope Java 2.x 系列【10】技能(Skill)
java·人工智能·agent
GDAL2 小时前
书签栏的 AI 转型:用 bge-small-zh-v1.5 重塑书签管理
人工智能·书签栏
摇滚侠2 小时前
SpringMVC 入门到实战 DispatcherServlet 源码解读 92-95
java·后端·spring·maven·intellij-idea
青山如墨雨如画2 小时前
【北邮-无线通信中的人工智能】物理层技术中AI的应用实践:基于KNN的调制识别(1)理论基础
人工智能·python·机器学习·matlab·jupyter