前言
老顾前面介绍了
《老顾深度解析【字节跳动的AI项目DeerFlow】源码(一)》
《老顾深度解析【字节跳动的AI项目DeerFlow】源码之协调者(二)》
《老顾深度解析【字节跳动的AI项目DeerFlow】源码之规划者(三)》
今天老顾给大家介绍另一个角色:人。
此角色 就是需要人进行干预,需要补充一些相关信息。然后再重点介绍一下前后端的交互逻辑。

用户提出的问题:作为40岁的男人,如何减肥?规划者Planner会结合背景调查进行分析 ,规划者Planner分析后,会在前端界面上显示【Edit plan】和【Start research】; 提示用户是Edit Plan进行人工中断来修改计划 或者 直接Start Research调用执行者。
这里我们就介绍人工中断的场景:"再增加运动器材的推荐"。
Agent流程图
我们先来看看整体的LangGraph的流程图,先上源码

这个源码就是我们前一篇文章中介绍的交互流程。我们看一下人工中断human_feedback在哪个位置
arduino
builder.add_node("human_feedback", human_feedback_node)
我们发现这里只有定义,那是怎么流转到人工中断节点的呢?
下面是规划者的方法节点,里面定了返回的节点,一个是人工中断,一个是报告。
less
def planner_node(
state: State, config: RunnableConfig
) -> Command[Literal["human_feedback", "reporter"]]:
前一篇文章介绍规划者Planner时,介绍了人工中断的逻辑,这里就不作重复介绍了。
人工中断Agent
来看看源码

我们来分析一下代码
ini
current_plan = state.get("current_plan", "")
获得规划者设计的内容current_plan 。
ini
auto_accepted_plan = state.get("auto_accepted_plan", False)
上面代码是获取【是否自动接受规划者的内容】的配置 ,这个配置代表是否不需要人工中断,直接调用执行者就行了。

ini
if not auto_accepted_plan:
feedback = interrupt("Please Review the Plan.")
符合人工中断条件,会调用interrupt方法,这个方法会暂停整个Graph执行,等待用户在前端的输入
前端交互
用户在前端进行咨询时,请求的接口是/api/chat/stream

上面的代码就是请求的入口
ini
thread_id = request.thread_id
if thread_id == "__default__":
thread_id = str(uuid4())
thread_id代表session会话,也是通过thread_id对不同的用户咨询进行隔离的。
我们继续往下看,_astream_workflow_generator方法

上面的红色框的if条件,如果用户没有点击Edit Plan这个按钮,这段红色框架就不会执行。

那我们看看如果用户点击了Edit Plan按钮,进行计划补充信息,然后再咨询提交 "再增加运动器材的推荐" ,我们看看请求的参数

里面有个interrupt_feedback参数,对应的值为edit_plan;在看看messages参数就是用户补充的内容。
我们再看看入口请求的代码
ini
if not auto_accepted_plan and interrupt_feedback:
resume_msg = f"[{interrupt_feedback}]"
# add the last message to the resume message
if messages:
resume_msg += f" {messages[-1]['content']}"
logger.info(f"Resume message: {resume_msg}")
input_ = Command(resume=resume_msg)
interrupt_feedback变量的值为edit_plan了,那条件为真,进入if分支。
resume_msg变量就是edit_plan加上用户的补充内容{messages[-1]['content']}。
最后resume_msg的值为: [edit_plan] 再增加运动器材的推荐
后面就是最主要的对象Command了,创建它并赋予resume参数。就是命令对象,resume参数是表示中断恢复。
执行graph

但是在上次中断的节点处恢复,也就是下面图中的红箭头标识的interrupt处。

中断恢复
我们继续往下看中断恢复后的代码
csharp
if feedback and str(feedback).upper().startswith("[EDIT_PLAN]"):
return Command(
update={
"messages": [
HumanMessage(content=feedback, name="feedback"),
],
},
goto="planner",
)
如果用户选择的是修改计划补充相关的信息,就再此调用Planner规划者Agent。
Start Research
如果用户不选择Edit Plan,那另一个选择就是Start Research

我来看看请求参数是什么样子

interrupt_feedback变量的值为accepted了,那我们看看下面的代码

如果是accepted表示接收规划者计划的内容 ,后面就goto=research_team流转到了执行者Agent
总结
上面就是人工中断的整体逻辑,更偏向工程化,没有和大模型进行交互,所以没有提示词。
上面讲解大家一定不要忘了有一个thread_id参数,这个参数的作用就是代表一次的咨询。
到这里人工中断Agent就介绍完了,后面会带来比较核心的执行者Agent。
好了,今天就介绍到这里,谢谢大家,记得关注老顾哦!!!