智能体是如何“思考”的:ReAct模式

🌟🌌 欢迎来到知识与创意的殿堂 --- 远见阁小民的世界!🚀

🌟🧭 在这里,我们一起探索技术的奥秘,一起在知识的海洋中遨游。

🌟🧭 在这里,每个错误都是成长的阶梯,每条建议都是前进的动力。

🌟🧭 在这里,我们一起成长,一起进步,让我们在知识的世界里畅游无阻,共同创造一个充满智慧和创新的明天。

🌟📚 点击关注,加入我们的技术探索之旅吧!❤️📖✨

✨博客主页:远见阁小民的主页

📕本文专栏:AI专栏

📕其他专栏:后端专栏 Linux专栏 白帽学徒笔记

大家好,我是小民,见字欢喜。

前面两篇文章,我们聊了智能体是什么,以及它和聊天机器人的区别。

今天咱们聊个更深入的问题:

智能体接到任务后,脑子里到底发生了什么?

它是蒙头乱试,碰运气?还是有着一套清晰的运行机制?

当然不是乱试啦~

目前主流的智能体,基本都遵循一个叫 ReAct 的模式。

今天我们就把它拆开来看看👇

01 ReAct是什么

ReAct 是两个词的组合:Reasoning(推理) + Acting(行动)

说白了就是:先想,再做;看完结果,接着想。

智能体不是一口气把事干完,而是需要走一个循环👇

用户输入➔思考➔行动➔观察

➔再思考➔再行动➔......➔最终输出

把这个循环画出来,大概是下面这个样子👇

图片里的流程可以拆成几个关键环节👇

  • 感知: 接收用户输入,听懂用户想干嘛
  • 规划: 决定下一步做什么,先干啥后干啥
  • 工具: 从可用的工具里选一个合适的(查天气、发邮件、写代码等)
  • 行动: 调用工具,执行并获取结果
  • 记忆: 贯穿全程,记录之前做过什么、观察到什么,不让智能体「失忆」

每一步都在「想一想」和「动动手」之间切换,直到把任务彻底搞定。

02 举个例子:用ReAct订机票

光说理论可能有点抽象,我们来看一个具体的例子:用户说"帮我订周五去上海的机票"

此时智能体的大脑里其实是这样的👇

  • 思考1: 用户要订周五去上海的机票;我需要先查航班,然后比价、选座、下单
  • 行动1: 调用航班查询接口
  • 观察1: 查到3个航班:800元(晚上)、950元(上午9点)、1200元(商务舱)
  • 思考2: 用户没给预算;查一下历史记录,发现他之前都选经济舱、偏好上午航班,9点那班符合
  • 行动2: 调用订票接口下单
  • 观察2: 下单成功,订单号已生成
  • 最终输出: 已为您预订周五上午9点飞往上海的航班,票价950元,行程已加入日历

我们可以看到,它不是一次性给答案,而是想一步、做一步、看一步、再想下一步。

那么如果中间出了意外呢?比如950元的航班突然没了?

  • 行动2: 调用订票接口下单
  • 观察2: 下单失败,该航班已售罄
  • 思考3: 9点航班没了;用户偏好上午,看看还有没有其他上午的航班
  • 行动3: 重新查询上午的航班
  • 观察3: 查到10:30还有一班,票价1020元
  • 思考4: 比原计划贵了70块,但还在合理范围内;先订上,然后在回复里说明一下
  • 行动4: 调用订票接口下单
  • 最终输出: 您偏好的9点航班已售罄,已为您预订10:30的航班,票价1020元,比原计划贵70元,您看可以吗?

通过上面的例子可以看出,这就是ReAct的厉害之处➔能应对意外,能自我调整。

03 为什么叫 ReAct

这个名字其实取得挺巧的,既取了「推理+行动」的首字母,又暗含了「反应」(React)的意思------智能体像人一样,根据观察到的情况做出下一步反应。

它跟传统的「输入➔输出」模式最大的不同是,智能体不是一次性回答,而是边做边看边调整。

就像你做一道菜,不是一口气把所有料倒进去,而是边尝边调味。

最后来个小结

ReAct模式,说白了就是让智能体从「会聊天」变成了「会干活」------先想想该干什么,动手干,看看结果,再想想下一步,继续干,直到任务完成。

好了,今天的学习就到这里了!

**欢迎在留言区许个愿哦~**👇

如果你有一个智能体助理,你最想让它帮你自动化做哪件事?定时抢票、整理周报,还是别的什么?

相关推荐
庄小焱1 分钟前
【AI模型】——RAG检索优化
ai·rag·ai模型·rag检索优化
卷卷说风控1 分钟前
【卷卷观察】Sora 倒了,Seedance 冲了,量子计算被 AI 接管了——这周的三条线索
人工智能·量子计算
北灵聊AI4 分钟前
Claude Opus 4.7 实测:对比 GPT-5.4
ai
深念Y7 分钟前
图数据库 vs 向量数据库:AI时代的两个“最强大脑”
数据库·人工智能·neo4j·图论··向量·rag
黎阳之光12 分钟前
黎阳之光核工厂202应急管控平台|全域实景孪生,筑牢核安全最后一道防线
大数据·人工智能·算法·安全·数字孪生
小程故事多_8020 分钟前
破局AI Agent落地困境,Harness六大组件全解析与实践启示
人工智能·自动化·ai编程
深念Y22 分钟前
感知机 ≈ 可学习的逻辑门?聊聊激活函数与二元分类的本质
人工智能·学习·分类·感知机·激活函数·逻辑门·二元分类
LaughingZhu23 分钟前
Product Hunt 每日热榜 | 2026-04-18
人工智能·经验分享·深度学习·神经网络·产品运营
Raink老师25 分钟前
【AI面试临阵磨枪】大模型中的温度(Temperature)、Top-p、Top-k、Repetition penalty 分别控制什么?
人工智能·ai 面试
大棉花哥哥34 分钟前
MAC下JADX+MCP+OpenCode自动APK逆向分析
macos·ai