llm的ReAct

文章目录


背景

想了解一下react的思路

https://github.com/StudyingLover/learn-llm-ReAct
https://til.simonwillison.net/llms/python-react-pattern


一、上下文累积机制

每次调用 bot(next_prompt) 时:

  • 不是替换:next_prompt 不是替换之前的上下文
  • 而是追加:新的观察结果被添加到 self.messages 列表中
  • 完整历史:LLM 每次都能看到从开始到现在的所有对话

  • 状态保持:ReAct 需要记住之前做了什么,才能决定下一步做什么
  • 推理链:多步推理需要基于完整的历史信息
  • 上下文连贯:避免每次都是"重新开始"

这就是 ReAct 能够进行复杂多步推理的核心机制 - 上下文累积,而不是简单的单次问答。

二、

相关推荐
lifallen2 小时前
从零推导多 Agent 协作网络 (Flow Agent)
人工智能·语言模型
KG_LLM图谱增强大模型3 小时前
MedHELM:真实临床医疗任务大语言模型的整体评估框架
人工智能·语言模型·自然语言处理
小超同学你好4 小时前
Langgraph 17. Skills 三级加载与 Token 优化(含代码示例)
人工智能·语言模型·langchain
吴佳浩 Alben4 小时前
GPU 编号错乱踩坑指南:PyTorch cuda 编号与 nvidia-smi 不一致
人工智能·pytorch·python·深度学习·神经网络·语言模型·自然语言处理
吴佳浩 Alben4 小时前
CUDA_VISIBLE_DEVICES、多进程与容器化陷阱
人工智能·pytorch·语言模型·transformer
大模型任我行5 小时前
腾讯:揭示评估幻觉并构建知识驱动新范式
人工智能·语言模型·自然语言处理·论文笔记
FserSuN8 小时前
论文学习《ReAct: 在大语言模型中协同推理与行动》
语言模型
zhangfeng11339 小时前
LLM 大语言模型 训练的时候 batchsize 调整大导致梯度爆炸问题解决
深度学习·机器学习·语言模型
Xpower 179 小时前
Clawith:开启多智能体协作的新纪元
人工智能·python·语言模型·自动化
AI浩10 小时前
引导多模态大语言模型用于弱监督类无关物体计数
人工智能·语言模型·自然语言处理