AgentState是LangChain中用来表示智能体 在执行过程中描述当前状态 的核心数据结构。它是整个工作流的"上下文容器"或"共享内存",在各个节点之间传递,并随着流程推进不断被读取、修改和持久化。所以我一般叫他**"运行时上下文状态对象"**
一、AgentState本质
它本质就是一个TypedDict,里面包含了任务执行过程中的状态数据(比如对话历史、中间结果、用户信息等)。它由下面三个组件组成:
| 组件 | 说明 |
|---|---|
| State(状态) | 在图中流动的共享内存对象,存储用户输入、中间结果、工具调用日志等 |
| Schema(模式) | 规定状态的数据结构和类型(通常用 TypedDict 或 Pydantic 定义) |
| Reducer(归约器) | 控制状态更新方式的函数(默认是覆盖,也可以追加、合并等) |
二、LangChain中的AgentState
在LangChain和LangGraph里面,提供了开箱即用的默认状态类,最常见的就是MessagesState
1、 默认 MessagesState
python
# 从langgraph中导入它
from langgraph.graph import MessagesState
# 就等价于自己手动定义了一个TypedDict
from typing import TypedDict, Annotated
import operator
class MessagesState(TypedDict):
messages: Annotated[list[BaseMessage], operator.add]
messages字段 :存储完整的对话消息序列(HumanMessage,AIMessage,ToolMessage等)。Annotated[..., operator.add]:这是关键!它表示当多个节点返回对messages的更新时,不是覆盖,而是追加(concatenate)。这确保了对话历史不会丢失。
2、自定义AgentState
完全可以自己扩展默认状态,添加业务所需字段。
python
from typing import TypedDict, Annotated, Optional
from langgraph.graph import MessagesState
from langchain_core.messages import BaseMessage
import operator
class CustomAgentState(MessagesState):
user_id: str # 用户标识
session_data: dict # 会话级临时数据
task_status: Optional[str] # 任务状态("pending", "completed")
search_results: Annotated[list[dict], operator.add] # 工具调用结果(可追加)
然后在创建 Agent 时传入自定义的运行时上下文状态对象。
python
# 假设之前定义好了下面的参数
agent = create_agent(
model=llm,
tools=[search_tool],
state_schema=CustomAgentState, # ← 传入自己定义的
checkpointer=checkpointer
)
调用的时候传入在AgentState中自定义的字段。
python
# config 作用是langgraph的可配置参数,用来控制运行时上下文。
config = {"configurable": {"thread_id": "1"}} # 线程级会话 id 当 Agent 被调用时,LangGraph 会自动从 检查点器Checkpointer中加载该 thread_id 对应的最新状态
# 初次调用输入数据,作用是传递给Agent,初始化State更新
inputs = {
"messages": [{"role": "user", "content": "查一下北京天气"}],
"user_id": "u_123",
"session_data": {"locale": "zh-CN"}
}
response1 = agent.invoke(input=inputs, config=config)
# 后续调用只需提供新消息,其他状态自动恢复
next_inputs = {"messages": [{"role": "user", "content": "那上海呢?"}]}
response2 = agent.invoke(next_inputs, config=config) # 仍记得 user_id 和之前的问题