llm的ReAct

文章目录


背景

想了解一下react的思路

https://github.com/StudyingLover/learn-llm-ReAct
https://til.simonwillison.net/llms/python-react-pattern


一、上下文累积机制

每次调用 bot(next_prompt) 时:

  • 不是替换:next_prompt 不是替换之前的上下文
  • 而是追加:新的观察结果被添加到 self.messages 列表中
  • 完整历史:LLM 每次都能看到从开始到现在的所有对话

  • 状态保持:ReAct 需要记住之前做了什么,才能决定下一步做什么
  • 推理链:多步推理需要基于完整的历史信息
  • 上下文连贯:避免每次都是"重新开始"

这就是 ReAct 能够进行复杂多步推理的核心机制 - 上下文累积,而不是简单的单次问答。

二、

相关推荐
盼小辉丶8 小时前
Transformer实战(19)——微调Transformer语言模型进行词元分类
深度学习·语言模型·分类·transformer
时序之心8 小时前
ACL 2025 Time-LlaMA 大语言模型高效适配时间序列预测
人工智能·语言模型·论文·llama·时间序列
小白学C++.8 小时前
大模型agent综述:A Survey on Large Language Model based Autonomous Agents
人工智能·语言模型·自然语言处理
中杯可乐多加冰9 小时前
高校迎新管理系统:基于 smardaten AI + 无代码开发实践
人工智能·低代码·语言模型·llm·vue·管理系统·无代码
jerryinwuhan12 小时前
公共安全事件分析-3
人工智能·语言模型·自然语言处理·nlp·知识图谱
SmartBrain9 天前
DeerFlow 实践:华为IPD流程的评审智能体设计
人工智能·语言模型·架构
JoannaJuanCV9 天前
大语言模型基石:Transformer
人工智能·语言模型·transformer
大千AI助手9 天前
TruthfulQA:衡量语言模型真实性的基准
人工智能·语言模型·自然语言处理·llm·模型评估·truthfulqa·事实性基准
张较瘦_9 天前
[论文阅读] 人工智能 + 软件工程 | 大语言模型驱动的多来源漏洞影响库识别研究解析
论文阅读·人工智能·语言模型