详解 astream 方法与 stream_mode，构建高级人机交互 Agent

LangGraph ：详解 astream 方法与 stream_mode，构建高级人机交互 Agent

引言【AI大模型教程】

在之前的教程中，我们构建了基础的 AI Agent。但你可能已经发现，无论是使用 invoke() 还是用于调试的 astream_log()，用户体验都存在延迟------在Agent完成所有思考和工具调用之前，用户只能看到一个等待状态。要构建一个能够与前端实时交互、提供良好用户体验的生产级应用，我们必须掌握 LangGraph 的核心流式传输机制 astream 方法及其 stream_mode 参数。这为我们提供了对图（Graph）执行过程中各个节点产生的数据进行精细化控制的能力。本篇文章将完全摒弃伪代码，从一个完整、可运行的基础 Agent 出发，不仅会深度解析 LangGraph 的流式数据模式，还将探讨高级的图执行控制技术，最终构建一个健壮、可观测的流式处理器。

在本期教程中，你将掌握：

•四种核心 stream_mode (values, updates, messages, custom) 的真实用法与适用场景。•如何实现类似 ChatGPT 的打字机流式输出效果。•如何通过中断与恢复机制，为 Agent 加入"人工审批"功能。•使用 Command 和 goto 实现节点间的动态路由。•如何构建一个能处理多种事件的统一流式处理器。

第一部分: 统一的准备工作

为了避免代码重复，我们首先定义一个贯穿本文所有示例的、完整且可运行的 Agent。后续所有示例都将基于这个 app 实例或其变体。

准备工作 ：在项目根目录下创建一个名为 .env 的文件，并填入的 API 密钥等信息，格式如下：

code-snippet__js 复制代码

OPENAI_API_KEY="sk-..."
TAVILY_API_KEY="tvly-..."
OPENAI_MODEL="gpt-4o"
OPENAI_BASE_URL="https://api.openai.com/v1"

完整代码：

code-snippet__js 复制代码

import os
import asyncio
import time
from typing importAnnotated,List,Generator
from typing_extensions importTypedDict
from langchain_core.messages importBaseMessage,HumanMessage,AIMessage,ToolMessage
from langchain_openai importChatOpenAI
from langgraph.graph importStateGraph,END
from langgraph.prebuilt importToolNode
from langgraph.config import get_stream_writer
from dotenv import load_dotenv
from langchain_tavily importTavilySearch
from langchain_tavily._utilities importTavilySearchAPIWrapper
from langgraph.checkpoint.memory importMemorySaver
import random
from langgraph.types importCommand
load_dotenv()
llm =ChatOpenAI(
model_name=os.environ.get("OPENAI_MODEL"),
temperature=0.9,
openai_api_base=os.environ.get("OPENAI_BASE_URL"),
openai_api_key=os.environ.get("OPENAI_API_KEY"),
)
search_tool =TavilySearch(
max_results=2,
api_wrapper=TavilySearchAPIWrapper(
tavily_api_key=os.environ.get("TAVILY_API_KEY"),
)
)
tools =[search_tool]
def add_messages(left: list[BaseMessage], right: list[BaseMessage])-> list[BaseMessage]:
"""将新消息列表追加到旧消息列表中"""
return left + right
classAgentState(TypedDict):
messages:Annotated[List[BaseMessage], add_messages]
def agent_node(state:AgentState):
"""思考节点：调用 LLM 决定下一步行动"""
print("--- Executing node: agent_node ---")
response = llm.bind_tools(tools).invoke(state['messages'])
return{"messages":[response]}
tool_node =ToolNode(tools=tools)
def router(state:AgentState)-> str:
"""路由：判断是否需要调用工具"""
print("--- Executing router ---")
last_message = state['messages'][-1]
if hasattr(last_message,'tool_calls')and last_message.tool_calls:
return"tool_node"
else:
return"END"
graph_builder =StateGraph(AgentState)
graph_builder.add_node("agent_node", agent_node)
graph_builder.add_node("tool_node", tool_node)
graph_builder.set_entry_point("agent_node")
graph_builder.add_conditional_edges(
"agent_node",
router,
{
"tool_node":"tool_node",
"END":END
}
)
graph_builder.add_edge("tool_node","agent_node")
app = graph_builder.compile()

第二部分: 四种核心 stream_mode

astream 的 stream_mode 参数决定了我们将从图的执行过程中接收到什么样的数据。让我们逐一解析这四种核心模式。

2.1 values 模式：获取完整状态快照

最适合场景：需要完整上下文进行调试，或在每一步之后将完整的状态传递给其他系统。
工作机制 ：在每个节点执行完毕后，astream 会 yield 当前 AgentState 的一个完整快照。这意味着你得到的是整个状态对象，而不仅仅是发生变化的部分。

code-snippet__js 复制代码

async def run_values_mode():
print("\n--- 模式: values ---")
inputs ={"messages":[HumanMessage(content="上海天气怎么样?")]}
async for chunk in app.astream(inputs, stream_mode="values"):
print("--- 状态快照 ---")
print(chunk)
print("-"*25)
asyncio.run(run_values_mode())

2.2 updates 模式：获取增量更新

最适合场景：后端服务间的状态同步或触发逻辑。它只关心"刚刚发生了什么变化"，数据传输量最小，效率最高。
工作机制 ：astream 只 yield 在上一步中被更新或添加的状态字段。例如，如果 agent_node 只返回了 {"messages": ...}，那么你收到的 chunk 就是 {'agent_node': {'messages': ...}}，指明了更新的来源和内容。

code-snippet__js 复制代码

async def run_updates_mode():
print("\n--- 模式: updates ---")
inputs ={"messages":[HumanMessage(content="上海天气怎么样?")]}
async for chunk in app.astream(inputs, stream_mode="updates"):
print(chunk)
print("-"*25)
asyncio.run(run_updates_mode())

2.3 messages 模式：构建聊天 UI 的核心

最适合场景：为前端提供数据流，以实现类似 ChatGPT 的打字机效果。这是实现此功能的唯一正确方式。
工作机制 ：专门用于流式传输 BaseMessage 对象。当 LLM 开始生成 token 时，astream 会持续 yield``AIMessageChunk 对象，使你能够实时地将内容渲染到 UI 上。

code-snippet__js 复制代码

async def run_messages_mode():
print("\n--- 模式: messages ---")
inputs ={"messages":[HumanMessage(content="上海天气怎么样?")]}
async for chunk in app.astream(inputs, stream_mode="messages"):
if chunk:
print(chunk[0].content,end="", flush=True)
print("-"*25)
asyncio.run(run_messages_mode())

2.4 custom 模式：自定义业务事件流

最适合场景 ：向客户端传递临时的业务信号（如"正在调用API"、"思考中..."），而无需污染核心的 messages 状态。
工作机制 ：在节点内部，通过 get_stream_writer() 获取一个写入器，并使用它来写入自定义事件。这些事件会通过 custom 模式流式传输，与核心状态完全分离。

code-snippet__js 复制代码

def agent_node_with_custom_event(state:AgentState):
print("--- Executing node: agent_node_with_custom_event ---")
writer = get_stream_writer()
writer({"data":"Retrieved 0/100 records","type":"progress"})
# 执行查询
writer({"data":"Retrieved 100/100 records","type":"progress"})
response = llm.bind_tools(tools).invoke(state['messages'])
return{"messages":[response]}
# 2. 构建并编译新图
graph_custom_builder =StateGraph(AgentState)
graph_custom_builder.add_node("agent_node", agent_node_with_custom_event)
graph_custom_builder.add_node("tool_node", tool_node)
graph_custom_builder.set_entry_point("agent_node")
graph_custom_builder.add_conditional_edges(
"agent_node",
router,
{
"tool_node":"tool_node",
"END":END
}
)
graph_custom_builder.add_edge("tool_node","agent_node")
app_custom = graph_custom_builder.compile()
# 3. 运行并监听
async def run_custom_mode():
print("\n--- 模式: custom ---")
inputs ={"messages":[HumanMessage(content="上海天气怎么样?")]}
async for chunk in app_custom.astream(inputs, stream_mode="custom"):
print(chunk)
asyncio.run(run_custom_mode())

第三部分: 高级图控制流

除了处理流式数据，LangGraph 还提供了强大的机制来控制图的执行流程。这些机制并非 stream_mode，而是图的核心功能，我们可以通过流式输出来观察它们的效果。

3.1 人机协作：中断与恢复

重要概念：中断（Interrupt）是一个编译时配置，它允许我们在图的执行过程中暂停，等待外部输入后再继续。这对于实现需要人工审批的复杂工作流至关重要。
工作机制 ：通过 compile(checkpointer=..., interrupt_after=["node_name"]) 来配置。当图执行到指定节点后，会暂停执行并保存当前状态。可以通过 astream 观察到图的暂停，并在之后通过传入 None 和相同的 thread_id 来恢复执行。

code-snippet__js 复制代码

checkpointer =MemorySaver()
app_interrupt = graph_builder.compile(checkpointer=checkpointer,interrupt_after=["agent_node"])
async def run_interrupt_mode_correctly():
print("\n--- Correctly Handling Interrupts ---")
# thread_id 就像一个"存档ID"，让我们可以恢复图的状态
config ={"configurable":{"thread_id":"interrupt-thread-1"}}
inputs ={"messages":[HumanMessage(content="上海天气怎么样?")]}
print("--- First run, streaming with 'values', expecting interrupt ---")
# 使用 "values" 模式运行，流会在中断点自动结束
async for chunk in app_interrupt.astream(inputs, config=config, stream_mode="updates"):
print("--- Stream Chunk ---")
print(chunk)
print("\n--- [Graph Interrupted] ---")
# 检查当前状态，确认我们正处于中断状态
current_state = await app_interrupt.aget_state(config)
print("\nLast message before interrupt:", current_state.values['messages'][-1])
# `next` 属性告诉我们下一步将执行哪个节点，这证明图已暂停
print("Next step would be:", current_state.next)
if current_state.next:# 如果 next 有值，说明图被中断了
print("\n--- Resuming execution ---")
# 传入 None 并使用相同的 config 来继续执行
async for chunk in app_interrupt.astream(None, config=config, stream_mode="updates"):
print("--- Resumed Chunk ---")
print(chunk)
print("-"*25)
asyncio.run(run_interrupt_mode_correctly())

注意：checkpointer 是实现中断和状态持久化的核心组件，必须在编译图时显式指定。LangGraph 提供多种 Checkpointer 实现，适用于不同场景：

实现类型	用途	安装命令	备注
`InMemorySaver`	测试和调试，内存存储	无需额外安装	不适合生产，适合快速原型
`SqliteSaver`	本地轻量级同步存储	`pip install langgraph-checkpoint-sqlite`	适合本地实验和开发
`AsyncSqliteSaver`	本地轻量级异步存储	`pip install aiosqlite langgraph-checkpoint-sqlite`	需 aiosqlite 支持
`PostgresSaver`	生产环境，PostgreSQL 存储	`pip install langgraph-checkpoint-postgres`	推荐生产环境
`AsyncPostgresSaver`	生产环境，异步 PostgreSQL 存储	`pip install langgraph-checkpoint-postgres`	适合高并发生产场景
`MongoDBSaver`	MongoDB 存储	`pip install langgraph-checkpoint-mongodb`	适合 NoSQL 场景
`AsyncMongoDBSaver`	异步 MongoDB 存储	`pip install langgraph-checkpoint-mongodb`	异步版本，需 pymongo 支持
`RedisSaver`	Redis 存储	`pip install langgraph-checkpoint-redis`	适合高性能缓存场景
`AsyncRedisSaver`	异步 Redis 存储	`pip install langgraph-checkpoint-redis`	异步版本，适合高并发缓存场景

3.2 动态路由：Command 的用法

Command 对象允许节点向 LangGraph 执行器下达更精确的指令，最强大的功能就是动态路由。

Command(goto="..."): 动态覆盖图的路由

它允许一个节点在运行时动态决定下一步去往哪个节点，从而覆盖预定义的静态图结构。add_edge 定义了固定的流程，而 goto 提供了基于运行时逻辑的灵活跳转能力。

代码示例：构建一个带"质量审核"的动态跳转图

我们构建一个流程：生成内容 -> 验证内容。验证节点将使用 goto 动态决定是直接结束，还是强制跳转到一个我们并未在图中显式连接的"人工审核"节点。

code-snippet__js 复制代码

classGenerationState(TypedDict):
messages: list
generation: str
def generator_node(state:GenerationState):
print(">>> 正在执行: generator_node")
return{"generation":"这是一个初步生成的答案。"}
def validator_node(state:GenerationState):
print(">>> 正在执行: validator_node")
quality_score = random.random()
print(f"答案质量分: {quality_score:.2f}")
if quality_score >0.7:
print("--- 决策: 质量合格，直接结束 ---")
returnCommand(goto=END)
else:
print("--- 决策: 质量不合格，强制跳转到人工审核 ---")
returnCommand(goto="human_review")
def human_review_node(state:GenerationState):
print(">>> 正在执行: human_review_node (需要人工介入！)")
returnCommand(update={"generation": state['generation']+" [经过人工优化]"})
# 构建图，我们故意不画 validator 到 human_review 的边
graph_dynamic =StateGraph(GenerationState)
graph_dynamic.add_node("generator", generator_node)
graph_dynamic.add_node("validator", validator_node)
graph_dynamic.add_node("human_review", human_review_node)
graph_dynamic.set_entry_point("generator")
graph_dynamic.add_edge("generator","validator")
graph_dynamic.add_edge("human_review","validator")# 审核后再次验证
app_dynamic = graph_dynamic.compile()
# 多次运行，会看到它有时直接结束，有时会进入 human_review
print("\n--- 运行动态跳转图 ---")
result = app_dynamic.invoke({"messages":[]})
print(result['generation'])

第四部分: 构建具备动态修正能力的研究助手

现在，我们将所有知识点整合起来：使用核心 stream_mode 来观测数据，并利用高级控制流（中断和动态路由）来构建一个更智能的 Agent。

状态与节点定义

code-snippet__js 复制代码

from functools import partial
def add_messages(left: list[BaseMessage], right: list[BaseMessage],k:int=10)-> list[BaseMessage]:
"""将新消息列表追加到旧消息列表中"""
full_list = left + right
return full_list[-k:]
classResearchState(TypedDict):
messages:Annotated[list[BaseMessage],partial(add_messages, k=10)]
search_results: list |None
draft_report: str |None
async def generate_draft_node(state:ResearchState):
"""根据搜索结果生成报告初稿"""
print("--- Executing node: generate_draft_node (AI正在撰写初稿...) ---")
prompt = f"根据以下搜索结果，为用户的最后一个问题生成一份详细的报告初稿: {state['search_results']}"
messages = state["messages"]+[("user", prompt)]
response = await llm.ainvoke(messages)
return{"draft_report": response.content}
def human_review_node(state:ResearchState):
"""人类审核节点 - 这个节点本身不执行逻辑，仅作为中断点"""
print("--- Reached node: human_review_node (等待人类审核...) ---")
return{}
def finalize_report_node(state:ResearchState):
"""根据（可能被修改过的）初稿生成最终消息"""
print("--- Executing node: finalize_report_node (生成最终报告...) ---")
reviewed_report = state["draft_report"]
final_message =AIMessage(content=f"这是根据您的审核生成的最终报告：\n\n{reviewed_report}")
return{"messages":[final_message]}
def quality_check_node(state:ResearchState):
"""
检查搜索结果的质量，并使用goto动态决定下一步。
"""
print("--- Executing node: quality_check_node ---")
writer = get_stream_writer()
writer({"status":"正在评估搜索结果质量...","type":"quality_check_node"})
search_results = state.get("search_results")
if not search_results or len(search_results) < 2:
print("--- 决策: 搜索结果不足，中断并请求用户澄清 ---")
return Command(goto="clarify_with_user_node")
else:
print("--- 决策: 搜索结果充足，跳转至报告生成 ---")
return Command(goto="generate_draft_node")
def clarify_with_user_node(state:ResearchState):
"""生成需要用户澄清的提示消息"""
clarify_msg =AIMessage(content="搜索结果不足，请提供更具体的问题或补充信息。")
return{"messages":[clarify_msg]}
def agent_node(state:ResearchState):
"""思考节点：调用 LLM 决定下一步行动"""
response = llm.bind_tools(tools).invoke(state['messages'])
return{"messages":[response]}
def tool_executor(state:ResearchState):
"""执行工具并提取结果到 search_results"""
tool_node =ToolNode(tools=tools)
tool_output = tool_node.invoke(state)
tool_results =[]
for msg in tool_output["messages"]:
if isinstance(msg,ToolMessage):
import json
tool_results.append(json.loads(msg.content))
return{
# "messages": tool_output["messages"],
"search_results": tool_results
}
def router(state:ResearchState)-> str:
"""路由：判断下一步是调用工具、直接结束还是进入质量检查"""
last_message = state['messages'][-1]
if hasattr(last_message,'tool_calls')and last_message.tool_calls:
return"tool_node"
else:
return"END"

构建并编译终极版图

code-snippet__js 复制代码

final_graph_builder =StateGraph(ResearchState)
final_graph_builder.add_node("agent_node", agent_node)
final_graph_builder.add_node("tool_node", tool_executor)
final_graph_builder.add_node("quality_check_node", quality_check_node)
final_graph_builder.add_node("clarify_with_user_node", clarify_with_user_node)
final_graph_builder.add_node("generate_draft_node", generate_draft_node)
final_graph_builder.add_node("human_review_node", human_review_node)
final_graph_builder.add_node("finalize_report_node", finalize_report_node)
final_graph_builder.add_edge("generate_draft_node","human_review_node")
final_graph_builder.add_edge("human_review_node","finalize_report_node")
final_graph_builder.add_edge("finalize_report_node",END)
final_graph_builder.set_entry_point("agent_node")
final_graph_builder.add_conditional_edges(
"agent_node",
router,
{
"tool_node":"tool_node",
"END":END
}
)
final_graph_builder.add_edge("tool_node","quality_check_node")
final_graph_builder.add_edge("clarify_with_user_node",END)
final_checkpointer =MemorySaver()
app = final_graph_builder.compile(
checkpointer=final_checkpointer,
interrupt_before=["human_review_node","clarify_with_user_node"],
)

运行与解读

code-snippet__js 复制代码

async def run_collaborative_session():
config ={"configurable":{"thread_id":"collab-thread-2"}}
inputs ={"messages":[HumanMessage(content="对比一下LangGraph和传统的LangChain Agent在实现复杂工作流时的优劣势")]}
print("--- [Session Start] ---")
# 1. 启动图，它将运行直到第一个中断点
async for output in app.astream(inputs, config=config):
for key, value in output.items():
print(f"Node '{key}' output: {value}")
# 2. 检查中断状态
current_state = await app.aget_state(config)
# 检查是否在 human_review_node 中断
if "human_review_node" in current_state.next:
print("\n--- [Graph Interrupted for Human Review] ---")
# 3. 从状态中提取生成的初稿
draft_report = current_state.values.get("draft_report")
print("\nAI 生成的报告初稿：")
print("--------------------")
print(draft_report)
print("--------------------")
# 4. 模拟用户在前端页面进行修改
print("\n请在下方确认或修改报告内容。如果无需修改，直接按回车。")
user_feedback = input("您的修改版本: ")
# 如果用户没有输入，则使用原始初稿
if not user_feedback.strip():
final_draft = draft_report
print("--- 用户已确认，使用原始初稿继续 ---")
else:
final_draft = user_feedback
print("--- 用户已提交修改，使用新版本继续 ---")
resume_inputs ={"draft_report": final_draft}
print("\n--- [Session Resumed] ---")
async for output in app.astream(resume_inputs, config=config):
for key, value in output.items():
print(f"Node '{key}' output: {value}")
# 6. 获取并打印最终结果
final_state = await app.aget_state(config)
if not final_state.next:
final_message = final_state.values["messages"][-1]
print(final_message.content)
if __name__ =="__main__":
asyncio.run(run_collaborative_session())

总结

在本次教程中，我们系统性地学习了 LangGraph 的流式处理与高级控制机制：

•掌握了 astream 的四种核心模式，实现了从状态快照到实时消息的精确数据流。•通过中断与恢复机制，为 Agent 工作流加入了关键的"人工审批"环节。•学会使用 Command 和 goto 实现动态路由，让 Agent 决策更灵活。•最终，我们将所有技术点融合，构建了一个功能完整、可观测的协作式 Agent。

至此，你已经具备了构建高级 Agent 所需的流式处理与流程控制的全部核心技术。

后续

我们的 Agent 已经变得相当强大，但它仍然是"单兵作战"。在许多复杂场景下，我们需要一个"专家团队"协同工作。在下一期中，我们将进入 LangGraph 多智能体协作。我们将学习如何设计和编排多个独立的 Agent，让它们作为一个团队来解决更宏大的任务。

如果喜欢本文，欢迎点赞、收藏、转发。有任何问题，也欢迎在评论区留言讨论！