Prompt给到LLM后的完整执行链

Prompt 到答案,中间发生了 7 件事

用户说"我的订单到哪了",半秒后收到回复。黑盒里是这样的。


全流程一览

步骤 发生了什么 在哪一层
1 前端打包请求,POST /chat 前端
2 构建 AgentExecutor FastAPI
3 把上下文塞进 Prompt Prompt 层
4 LLM 第一次推理,选工具 LLM
5 工具执行,查数据库 工具层
6 LLM 第二次推理,生成答案 LLM
7 存记忆,返回前端 Memory

步骤 1 --- 前端打包请求

json 复制代码
{
  "input": "订单 ORD-001 到哪了",
  "session_id": "sess_abc123"
}

session_id 是前端启动时随机生成的,后端靠它区分不同用户的对话历史。


步骤 2 --- 构建 AgentExecutor

FastAPI 收到请求,调 build_executor(session_id)

这个函数把四件东西组装在一起:

  • LLM --- DeepSeek,temperature=0,输出格式稳定
  • Tools --- 8 个 @tool 函数
  • Memory --- 按 session_id 隔离,保留最近 10 轮对话
  • Prompt --- ReAct 模板
python 复制代码
executor = build_executor(body.session_id)
result = executor.invoke({"input": body.input})

步骤 3 --- Prompt 构建

发给 LLM 之前,5 个变量自动填充:

复制代码
{tools}           ← 8 个工具的名称和 docstring
{tool_names}      ← 工具名列表
{chat_history}    ← 历史对话
{input}           ← 用户这次的输入
{agent_scratchpad} ← 推理暂存区(空的,后面会填)

LLM 靠读 {tools} 里的 docstring 决定调哪个工具。

docstring 写得越清楚,命中率越高。


步骤 4 --- LLM 第一次推理

LLM 读完 Prompt,输出:

复制代码
Thought: 用户在问订单 ORD-001 的状态,需要调 query_order 工具
Action: query_order
Action Input: ORD-001

AgentExecutor 解析这段输出,找到 query_order,准备执行。


步骤 5 --- 工具执行

python 复制代码
@tool
def query_order(order_id: str) -> str:
    """
    查询订单的状态和物流信息。
    当用户询问订单到哪里了、是否发货时调用。
    输入格式:ORD-XXXXX
    """
    order = db.query(Order).filter(Order.id == order_id).first()
    return f"订单 {order_id}:{order.product_name},已发货,快递 {order.tracking_no},明天到"

返回字符串即 Observation,追加进 {agent_scratchpad},再次发给 LLM。


步骤 6 --- LLM 第二次推理

LLM 看到 Observation,判断信息够了:

复制代码
Thought: 已经拿到订单信息,可以直接回答
Final Answer: 您的订单 ORD-001(iPhone 15)已发货,
快递单号 SF1234567890,预计明天送达

看到 Final Answer,循环结束。

如果信息不够,LLM 会继续选工具,最多循环 5 次。


步骤 7 --- 存记忆,返回前端

对话存进 Memory:

python 复制代码
memory.save_context(
    {"input": "订单 ORD-001 到哪了"},
    {"output": "您的订单 ORD-001 已发货..."}
)

结果打包返回:

json 复制代码
{
  "output": "您的订单 ORD-001 已发货...",
  "intermediate_steps": [
    [{"tool": "query_order", "tool_input": "ORD-001", "log": "..."},
     "订单 ORD-001:iPhone 15,已发货,快递 SF1234567890,明天到"]
  ]
}

intermediate_steps 就是前端 Debug 面板展示的推理链路。


三个关键点

LLM 调用了两次,一次选工具,一次生成答案。工具越多调用越多,响应越慢。

docstring 比代码更重要,LLM 靠它判断要不要调这个工具,写得模糊工具就不会被选中。

调试看 intermediate_steps,每一步 Thought / Action / Observation 都记录在里面,不用猜。


遇到问题怎么排查

复制代码
工具没被调用   →  检查 docstring,描述不够清楚
工具调了结果错  →  检查工具函数,数据库查询是否正确
格式解析失败   →  temperature 设成 0,Prompt 模板变量是否完整
响应很慢      →  减少 max_iterations,或者工具数量太多
相关推荐
岳小哥AI几秒前
AI的至暗历史:从万众期待到被政府撤资,AI的两次死亡徘徊
ai·ai基础
catoop1 小时前
AgentScope-Java v2.0 版本 ReActAgent vs HarnessAgent 差异解析与场景选择
ai
Elastic 中国社区官方博客10 小时前
Elasticsearch DiskBBQ:使用原生 SIMD Blocks 实现快 40% 的向量评分计算
大数据·人工智能·elasticsearch·搜索引擎·ai·全文检索·diskbbq
男孩李11 小时前
浅谈open jiuwen
人工智能·ai
Elastic 中国社区官方博客11 小时前
Kibana:使用 AI Chat 及 MCP 轻松创建 AI 原生仪表板
大数据·数据库·人工智能·elasticsearch·搜索引擎·ai·信息可视化
汤姆yu12 小时前
原生一体化多模态大模型技术研究
ai·大模型·多模态·智能体
汤姆yu16 小时前
Agentic AI自主智能体技术深度研究
人工智能·ai·智能体
哥布林学者16 小时前
深度学习进阶(二十七)现代 LLM 的核心架构设计其二:SwiGLU
机器学习·ai
coderwei12317 小时前
从OpenAI到Strip:用六大支柱读懂Harness Engineering的生产实践
python·ai·ai编程
小真zzz17 小时前
当“虚构的解决方案”成为试金石:搜极星如何将市场幻想变为可验证的现实?
搜索引擎·ai·大模型·deepseek