llm的ReAct

文章目录


背景

想了解一下react的思路

https://github.com/StudyingLover/learn-llm-ReAct
https://til.simonwillison.net/llms/python-react-pattern


一、上下文累积机制

每次调用 bot(next_prompt) 时:

  • 不是替换:next_prompt 不是替换之前的上下文
  • 而是追加:新的观察结果被添加到 self.messages 列表中
  • 完整历史:LLM 每次都能看到从开始到现在的所有对话

  • 状态保持:ReAct 需要记住之前做了什么,才能决定下一步做什么
  • 推理链:多步推理需要基于完整的历史信息
  • 上下文连贯:避免每次都是"重新开始"

这就是 ReAct 能够进行复杂多步推理的核心机制 - 上下文累积,而不是简单的单次问答。

二、

相关推荐
阿杰学AI4 小时前
AI核心知识123—大语言模型之 KV Cache
人工智能·ai·语言模型·自然语言处理·aigc·kv cache·键值缓存
阿杰学AI7 小时前
AI核心知识124—大语言模型之 智能体工程
人工智能·ai·语言模型·自然语言处理·agent·智能体·智能体工程
念谨7 小时前
【Diy-LLM】Task 1 分词器笔记
语言模型·datawhale·组队学习·cs336 中文课程
海海不掉头发8 小时前
【AI-大语言模型】医疗问诊AI大模型从0到1实战手册
人工智能·语言模型·自然语言处理
MRDONG18 小时前
从 Prompt 到智能体系统:Function Calling、Memory 与 Synthetic RAG 的全栈解析
人工智能·深度学习·神经网络·语言模型·自然语言处理·prompt
小超同学你好8 小时前
OpenClaw 深度解析与源代码导读 · 第2篇:Skills——能力扩展平面与源码中的「目录即技能」
人工智能·语言模型
weitingfu9 小时前
大语言模型架构演进:从BERT到GPT再到Mamba的正确打开方式
人工智能·ai·语言模型·架构·bert·agent·ai编程
小超同学你好1 天前
OpenClaw 深度解析与源代码导读 · 第3篇:Gateway——常驻控制面、单端口多协议与进程骨架
人工智能·深度学习·语言模型·gateway
Hello.Reader1 天前
从零构建大语言模型分词器从零实现 — 从原始文本到 Token ID
人工智能·语言模型·自然语言处理
sp_fyf_20241 天前
【大语言模型】 揭开指令混合用于大语言模型微调的神秘面纱
人工智能·深度学习·神经网络·机器学习·语言模型·自然语言处理