llm的ReAct

文章目录


背景

想了解一下react的思路

https://github.com/StudyingLover/learn-llm-ReAct
https://til.simonwillison.net/llms/python-react-pattern


一、上下文累积机制

每次调用 bot(next_prompt) 时:

  • 不是替换:next_prompt 不是替换之前的上下文
  • 而是追加:新的观察结果被添加到 self.messages 列表中
  • 完整历史:LLM 每次都能看到从开始到现在的所有对话

  • 状态保持:ReAct 需要记住之前做了什么,才能决定下一步做什么
  • 推理链:多步推理需要基于完整的历史信息
  • 上下文连贯:避免每次都是"重新开始"

这就是 ReAct 能够进行复杂多步推理的核心机制 - 上下文累积,而不是简单的单次问答。

二、

相关推荐
风落无尘4 小时前
第九章《语言与理解》 完整学习资料
gpt·rnn·语言模型·transformer
malog_4 小时前
大语言模型后训练全解析
人工智能·深度学习·机器学习·ai·语言模型
神秘的土鸡5 小时前
Agent 落地:贴合健身真实场景的 AI 人物跟练方案
ai·语言模型·agent
qq_525513758 小时前
# 第七章 指令微调学习(四) 7.6基于指令数据对大语言模型进行微调
深度学习·学习·语言模型
玄米乌龙茶1238 小时前
LLM成长笔记(四):大语言模型(LLM)基础认知
人工智能·笔记·语言模型
Yingjun Mo8 小时前
(二) LLM探索能力-1. 大语言模型能够进行上下文探索吗?
人工智能·语言模型·自然语言处理
tzc_fly9 小时前
LLaDA2.0-Uni:基于扩散语言模型的统一多模态理解和生成
人工智能·语言模型·自然语言处理
AI技术控10 小时前
LangChain 是什么?从零开始学会 LangChain 的工程实践指南
人工智能·语言模型·自然语言处理·langchain·nlp
Honey Ro11 小时前
浅析大模型 Agent 的记忆(Memory)机制
深度学习·语言模型·llm·rag
小明同学0113 小时前
C++后端项目:统一大模型接入 SDK(五)
服务器·c++·后端·计算机网络·语言模型