大模型应用开发工程师-面试题系列 - 2026年05月12日考题

LLM Agent(大语言模型智能体)面试复习指南:
核心考点一:Agent 的定义与架构 (Q1)
1. 本质定义
Agent 不仅仅是聊天机器人,它是一个能感知、思考、规划、行动并调用工具来完成复杂任务的 AI 系统。
2. 核心能力循环 (7大能力)
- 感知 (Perception) :听懂人话。
- 推理 (Reasoning) :分析问题。
- 规划 (Planning) :拆解任务(最关键)。
- 行动 (Action) :调用工具。
- 记忆 (Memory) :存上下文(短期/长期/向量)。
- 反思 (Reflection) :自我纠错。
- 多轮迭代:不达目标不停止。
3. 核心架构组件
- 大脑:LLM 推理核心。
- 手脚:Tool Use (调用搜索、代码、API 等外部工具)。
- 记忆库:Memory 系统。
- ** planner**:Planning 模块。
- 环境:外部环境/工具。
4. 面试加分点 (Agent vs. Chatbot/Workflow)
- Chatbot:一次性回答,无规划,无工具。
- Workflow:固定步骤,人工设定好的流程。
- Agent :动态规划、自主决策、自主选工具、可纠错。
- 本质理解 :Agent 本质上是一个状态机 (State Machine) 。
核心考点二:ReAct 框架 (Q2)
1. 核心概念
ReAct = Reasoning (思考) + Acting (行动) 。
它是一种将"思维链"和"行动"紧密结合的范式。
2. 工作流程 (核心循环)
这是一个闭环系统:
- Thought (思考) :LLM 想下一步干嘛。
- Action (行动) :调用工具执行。
- Observation (观察) :看工具返回的结果。
- Thought (再思考) :根据结果决定下一步。
- 循环直到任务完成 (Finish)。
3. 优缺点
- 优点:推理透明(可见每一步)、行动灵活(动态调整)、减少幻觉(有事实反馈)。
- 缺点:步数多(效率低)、消耗上下文(Token 贵)。
核心考点三:规划能力 (Q3)
1. 为什么重要?
因为复杂任务无法一步完成,必须拆解、评估、动态调整。规划能力是 Agent 智能化的核心。
2. 主流规划方法 (8种)
- CoT (思维链) :线性推理,简单任务用。
- ToT (思维树) :多路径探索,像下棋一样看几步,选最优。
- GoT (图式思维) :构建步骤依赖图,支持回溯和跳转,适合超复杂任务。
- Plan-and-Execute:先写好完整计划,再执行。稳定、可控。
- ReAct:边想边做,动态规划。适合需要大量外部交互的任务。
- Self-Refine:自我反思优化。先生成草稿,再修改,适合高质量输出。
- LLM + Search:检索增强规划。结合外部知识做计划。
- Memory-Augmented:记忆增强。基于历史经验做计划。
3. 如何选择?
- 简单任务 → CoT
- 复杂多路径 → ToT / GoT
- 需要稳定可控 → Plan-and-Execute
- 需要动态交互 → ReAct
- 需要高质量/知识 → Self-Refine / LLM+Search
4. 面试加分点
- 没有完美的单一方法,未来趋势是多种规划方法的融合 (Hybrid Agent) 。