llm的ReAct

文章目录


背景

想了解一下react的思路

https://github.com/StudyingLover/learn-llm-ReAct
https://til.simonwillison.net/llms/python-react-pattern


一、上下文累积机制

每次调用 bot(next_prompt) 时:

  • 不是替换:next_prompt 不是替换之前的上下文
  • 而是追加:新的观察结果被添加到 self.messages 列表中
  • 完整历史:LLM 每次都能看到从开始到现在的所有对话

  • 状态保持:ReAct 需要记住之前做了什么,才能决定下一步做什么
  • 推理链:多步推理需要基于完整的历史信息
  • 上下文连贯:避免每次都是"重新开始"

这就是 ReAct 能够进行复杂多步推理的核心机制 - 上下文累积,而不是简单的单次问答。

二、

相关推荐
2501_948120154 小时前
基于量化感知训练的大语言模型压缩方法
人工智能·语言模型·自然语言处理
阿杰学AI7 小时前
AI核心知识75——大语言模型之MAS (简洁且通俗易懂版)
人工智能·ai·语言模型·自然语言处理·agent·多智能体协作·mas
AndrewHZ9 小时前
【AI黑话日日新】什么是AI智能体?
人工智能·算法·语言模型·大模型·llm·ai智能体
shangjian00712 小时前
AI-大语言模型LLM-概念术语-Dropout
人工智能·语言模型·自然语言处理
余俊晖12 小时前
多模态视觉语言模型:Molmo2训练数据、训练配方
人工智能·语言模型·自然语言处理
阿杰学AI12 小时前
AI核心知识76——大语言模型之RAG 2.0(简洁且通俗易懂版)
人工智能·ai·语言模型·自然语言处理·rag·检索增强生成·rag2.0
shangjian00712 小时前
AI-大语言模型LLM-Transformer架构7-模型参数量计算
人工智能·语言模型·transformer
大模型任我行14 小时前
上海AI Lab:构建诊断型Agent守门员
人工智能·语言模型·自然语言处理·论文笔记
AndrewHZ14 小时前
【AI黑话日日新】什么是skills?
语言模型·大模型·llm·claude code·skills
shangjian00714 小时前
AI-大语言模型LLM-概念术语-Causal LM
人工智能·语言模型·自然语言处理