基于LangChain与DeepSeek实现Plan-and-Execute Agent,让AI学会"先规划后行动"
在AI Agent开发领域,"如何让模型高效完成复杂多步任务"一直是核心痛点。传统Agent常陷入"走一步看一步"的局限,面对多步骤协作任务时容易偏离目标、效率低下。而Plan-and-Execute(规划-执行)模式的出现,完美解决了这一问题------它让AI先"想清楚"再"动手做",实现了任务拆解与工具执行的高效闭环,今天就结合实际实践,聊聊如何基于LangChain与DeepSeek搭建属于自己的Plan-and-Execute Agent。
一、先搞懂:Plan-and-Execute到底是什么?
Plan-and-Execute Agent的核心的是"分工明确":它将复杂任务拆解为两个核心模块------规划器(Planner)和执行器(Executor),二者各司其职、协同工作,彻底摆脱了传统Agent"边想边做"的混乱逻辑,让多步任务执行更高效、更可控。
二、Plan-and-Execute的核心特点:为什么值得用?
相比于传统的React风格Agent,Plan-and-Execute模式有着不可替代的优势,尤其适合复杂多步任务场景,这也是它在AI Agent开发中越来越受欢迎的原因:
1. 任务拆解更清晰,目标更聚焦
面对"先计算、再查时间、最后回复问候"这类多步骤任务,Plan-and-Execute不会盲目执行,而是先由规划器将复杂任务拆解为一个个简单、可落地的子步骤,明确每个步骤的目标和执行顺序。这种"化整为零"的思路,能有效避免Agent偏离核心目标,让每一步执行都有明确方向。
2. 工具调用更高效,资源更节省
Plan-and-Execute的执行器专门负责调用外部工具,规划器则专注于任务拆解和流程把控,分工明确让效率大幅提升。同时,它无需在每个子步骤都调用大模型,可根据需求选用轻量模型执行子任务,大幅降低API调用成本,兼顾效率与经济性。
3. 支持多轮记忆,交互更连贯
虽然Plan-and-Execute模式默认不支持对话记忆,但通过简单的手动配置,就能实现多轮对话的上下文衔接。这意味着Agent能记住之前的交互内容,后续执行任务时无需重复输入,交互体验更流畅,更贴近真实的人机对话场景。
4. 容错性更强,执行更稳定
执行过程中若出现工具调用失败(如本次实践中遇到的link fetch error链接获取失败),Agent不会直接崩溃,而是会根据错误反馈重新调整执行计划,确保任务尽可能完成。这种灵活的容错机制,让Agent在实际应用中更具实用性。
三、实操落地:基于LangChain与DeepSeek的实现思路
本次实践以DeepSeek为大模型基座,借助LangChain的相关工具,快速搭建Plan-and-Execute Agent,核心实现分为5个关键环节,全程无复杂代码,逻辑清晰且易于落地:
1. 模型初始化:搭建核心动力
首先需要完成DeepSeek大模型的初始化配置,这是Agent的"大脑"。核心是配置模型的API密钥、基础地址、模型版本以及相关参数------比如温度参数控制模型输出的随机性,最大生成 tokens 控制响应长度,合理的参数配置能让模型的规划和执行更稳定。
2. 工具定义:给Agent配备"手脚"
Plan-and-Execute依赖外部工具完成具体执行,因此需要提前定义常用工具并注册到Agent中。本次实践中,我们配置了三类基础工具:数学计算工具、当前时间获取工具、简单问答工具,每个工具都明确了功能和使用场景,让执行器能根据子步骤需求,精准调用对应的工具完成操作。
3. 核心组件搭建:规划器与执行器协同工作
这是整个Agent的核心环节,主要完成规划器和执行器的创建与组合。规划器负责接收用户任务、拆解子步骤,明确"先做什么、再做什么、用什么工具做";执行器则按照规划器制定的步骤,逐个调用工具执行,获取执行结果并反馈给规划器。二者通过LangChain提供的工具无缝衔接,形成完整的"规划-执行"闭环。
4. 对话记忆配置:实现多轮交互
由于Plan-and-Execute模式默认不支持对话记忆,我们需要手动添加记忆模块,将每一轮的用户输入和Agent响应保存起来。这样后续用户输入新任务时,Agent能调用历史对话记录,理解上下文,避免重复提问,让交互更连贯自然。
5. 主循环封装:让Agent可直接启动使用
最后,通过主循环封装,让Agent能够接收用户输入、处理任务、返回响应,同时处理执行过程中可能出现的错误(如链接获取失败、工具调用异常等)。封装完成后,只需启动程序,就能与Agent进行交互,完成各类多步任务。
四、实践总结与避坑提示
通过本次实践,我们成功搭建了一个可直接使用的Plan-and-Execute Agent,核心收获在于理解了"规划与执行分离"的核心逻辑------Plan-and-Execute的优势不在于复杂的代码,而在于清晰的分工和高效的协同,让AI从"盲目执行"转变为"有计划地行动"。
同时也有两个避坑提示分享给大家:
- 模型配置时,需确保API密钥和基础地址正确,否则会出现类似"link fetch error"的链接获取失败问题,影响Agent正常执行;
- 工具定义时,要明确工具的功能和输入格式,避免执行器无法精准调用工具,导致任务执行失败。
代码实现:
# -*- coding: utf-8 -*-
"""
Plan-and-Execute Agent using DeepSeek via LangChain
- Planner: 拆解任务为子步骤
- Executor: 逐个执行子步骤(可调用工具)
- 支持多轮对话(通过手动注入历史)
------使用默认提示词
"""
import os
from datetime import datetime
from dotenv import load_dotenv
from langchain_openai import ChatOpenAI
from langchain.agents import Tool
from langchain.memory import ConversationBufferMemory
from langchain_experimental.plan_and_execute import (
PlanAndExecute,
load_agent_executor,
load_chat_planner,
)
load_dotenv()
# ========================
# 1. 初始化 DeepSeek LLM
# ========================
DEEPSEEK_API_KEY = "123" # 替换为实际的 API Key
llm = ChatOpenAI(
api_key=DEEPSEEK_API_KEY,
base_url="https://xxxxx.cn/v1", # Deepseek 的 API 基础地址
model="deepseek-v3:671b", # Deepseek 对话模型(可选:deepseek-chat-pro 等高级模型)
temperature=0.7, # 温度参数(0-1,越低越稳定)
max_tokens=1024 # 最大生成 tokens
)
# ========================
# 2. 定义本地工具
# ========================
def calculate(expr: str) -> str:
allowed = set("0123456789+-*/(). ")
if not all(c in allowed for c in expr):
return "错误:非法字符"
try:
return str(eval(expr, {"__builtins__": {}}, {}))
except Exception as e:
return f"计算失败: {e}"
def get_current_time(_) -> str:
return datetime.now().strftime("%Y年%m月%d日 %H:%M:%S")
def answer_simple_question(query: str) -> str:
knowledge = {
"你是谁": "我是基于 DeepSeek 的 Plan-and-Execute 智能助手。",
"你能做什么": "我可以制定计划并执行多步任务,比如计算、查时间、逻辑推理等。",
}
return knowledge.get(query.strip("?? "), "这个问题我暂时无法回答。")
tools = [
Tool(name="Calculator", func=calculate, description="执行数学计算,输入如 '2 + 3 * 4'"),
Tool(name="CurrentTime", func=get_current_time, description="获取当前日期和时间"),
Tool(name="SimpleQA", func=answer_simple_question, description="回答简单预设问题"),
]
# ========================
# 3. 创建 Plan-and-Execute Agent
# ========================
planner = load_chat_planner(llm)
executor = load_agent_executor(llm, tools, verbose=True)
agent = PlanAndExecute(planner=planner, executor=executor, verbose=True)
# 添加对话记忆(PlanAndExecute 默认不支持 memory,需手动处理)
memory = ConversationBufferMemory(memory_key="history", input_key="input")
# ========================
# 4. 执行函数(带记忆)
# ========================
def run_with_memory(user_input: str) -> str:
history = memory.load_memory_variables({}).get("history", "")
if history:
full_input = f"之前的对话:\n{history}\n\n现在用户问:\n{user_input}"
else:
full_input = user_input
# 使用 invoke 替代 run
response = agent.invoke({"input": full_input})["output"]
memory.save_context({"input": user_input}, {"output": response})
return response
# ========================
# 5. 主循环
# ========================
if __name__ == "__main__":
print("🧠 Plan-and-Execute Agent 启动!")
print("💡 示例:'先算 12*5,再告诉我现在几点,最后说你好'")
print("🛑 输入 'quit' 退出。\n")
while True:
user_input = input("👤 你: ").strip()
if not user_input or user_input.lower() in ["quit", "exit"]:
print("👋 再见!")
break
try:
response = run_with_memory(user_input)
print(f"🤖 助手: {response}\n")
except Exception as e:
print(f"❌ 错误: {e}\n")
执行结果:
🧠 Plan-and-Execute Agent 启动!
💡 示例:'先算 12*5,再告诉我现在几点,最后说你好'
🛑 输入 'quit' 退出。
👤 你: 先算 12*5,再告诉我现在几点,最后说你好
> Entering new PlanAndExecute chain...
steps=[Step(value='Calculate the product of 12 multiplied by 5.'), Step(value='Determine the current time.'), Step(value='Greet the user with "你好".'), Step(value="Given the above steps taken, please respond to the user's original question.\n")]
> Entering new AgentExecutor chain...
Thought: To calculate the product of 12 multiplied by 5, I will use the Calculator tool.
Action:
```
{
"action": "Calculator",
"action_input": "12 * 5"
}
```
Observation: 60
Thought:Action:
```
{
"action": "Final Answer",
"action_input": "The product of 12 multiplied by 5 is 60."
}
```
> Finished chain.
*****
Step: Calculate the product of 12 multiplied by 5.
Response: The product of 12 multiplied by 5 is 60.
> Entering new AgentExecutor chain...
Action:
```
{
"action": "CurrentTime",
"action_input": ""
}
```
Observation: 2026年04月14日 18:43:00
Thought:{
"action": "Final Answer",
"action_input": "The current time is 2026年04月14日 18:43:00."
}
> Finished chain.
*****
Step: Determine the current time.
Response: {
"action": "Final Answer",
"action_input": "The current time is 2026年04月14日 18:43:00."
}
> Entering new AgentExecutor chain...
```
{
"action": "Final Answer",
"action_input": "你好"
}
```
> Finished chain.
*****
Step: Greet the user with "你好".
Response: 你好
> Entering new AgentExecutor chain...
{
"action": "Final Answer",
"action_input": "你好\n\nThe product of 12 multiplied by 5 is 60.\n\nThe current time is 2026年04月14日 18:43:00."
}
> Finished chain.
*****
Step: Given the above steps taken, please respond to the user's original question.
Response: {
"action": "Final Answer",
"action_input": "你好\n\nThe product of 12 multiplied by 5 is 60.\n\nThe current time is 2026年04月14日 18:43:00."
}
> Finished chain.
🤖 助手: {
"action": "Final Answer",
"action_input": "你好\n\nThe product of 12 multiplied by 5 is 60.\n\nThe current time is 2026年04月14日 18:43:00."
}
更多学习资料尽在 老虎网盘资源