llm的ReAct

文章目录


背景

想了解一下react的思路

https://github.com/StudyingLover/learn-llm-ReAct
https://til.simonwillison.net/llms/python-react-pattern


一、上下文累积机制

每次调用 bot(next_prompt) 时:

  • 不是替换:next_prompt 不是替换之前的上下文
  • 而是追加:新的观察结果被添加到 self.messages 列表中
  • 完整历史:LLM 每次都能看到从开始到现在的所有对话

  • 状态保持:ReAct 需要记住之前做了什么,才能决定下一步做什么
  • 推理链:多步推理需要基于完整的历史信息
  • 上下文连贯:避免每次都是"重新开始"

这就是 ReAct 能够进行复杂多步推理的核心机制 - 上下文累积,而不是简单的单次问答。

二、

相关推荐
gravity_w12 小时前
Hugging Face使用指南
人工智能·经验分享·笔记·深度学习·语言模型·nlp
余俊晖13 小时前
多页文档理解强化学习设计思路:DocR1奖励函数设计与数据构建思路
人工智能·语言模型·自然语言处理
学历真的很重要14 小时前
LangChain V1.0 Context Engineering(上下文工程)详细指南
人工智能·后端·学习·语言模型·面试·职场和发展·langchain
柯南小海盗16 小时前
从“会聊天的AI”到“全能助手”:大语言模型科普
人工智能·语言模型·自然语言处理
ggaofeng16 小时前
运行调试大语言模型
人工智能·语言模型·自然语言处理
大模型任我行17 小时前
微软:小模型微调优化企业搜索
人工智能·语言模型·自然语言处理·论文笔记
羊羊小栈20 小时前
基于YOLO和多模态大语言模型的智能电梯安全监控预警系统(vue+flask+AI算法)
人工智能·yolo·语言模型·毕业设计·创业创新·大作业
开放知识图谱21 小时前
论文浅尝 | 图上生成:将大语言模型视为智能体与知识图谱以解决不完整知识图谱问答(EMNLP2024)
人工智能·语言模型·自然语言处理·知识图谱
爱吃羊的老虎2 天前
【大模型】向量数据库:Chroma、Weaviate、Qdrant
数据库·语言模型
imbackneverdie2 天前
Science最新文章:大型语言模型时代的科学生产
人工智能·语言模型·自然语言处理·aigc·ai写作