Agent 岗位高频面试题

Agent 岗位高频面试题：标准答案（简洁、专业、面试直接用）

我给你整理面试可直接背诵的版本，不啰嗦、全是重点、符合大厂 Agent / RAG 工程师真实工作经验。

一句话总结：从"检索不准、召回不全、上下文乱"三个方向下手。

数据预处理优化
- 文档清洗：去噪、去重、去乱码
- 分块优化：固定分块 → 语义分块 / 按标题分块 / 递归分块
- 增加元数据：文件名、章节、页码、时间，用于过滤
检索层优化（最重要）
- 向量模型升级：通用 embedding → 领域专用 embedding
- 多路召回：向量检索 + 关键词检索（BM25）+ 时间过滤
- 重排序（Rerank）：用小模型精排，大幅提升准确率
- 检索阈值：设置相似度分数过滤无关内容
Prompt 优化
- 强制要求"只使用参考资料回答"
- 不知道就说不知道，禁止编造
- 给参考资料加编号，要求引用来源
架构优化
- 多轮检索：复杂问题拆步骤，分步查资料
- 上下文压缩：把召回的长文本压缩成关键信息
- 路由 RAG：简单问题直接答，复杂问题才检索
评估优化
- 用指标：召回率、精确率、命中率、幻觉率
- 用 LLM 自动评估回答质量

面试标准回答：

RAG 优化围绕数据、检索、提示词、架构、评估 五方面。先做文档清洗与语义分块，再用多路召回+重排序提升检索精度，通过 Prompt 约束模型只依赖资料，复杂问题用多轮检索与上下文压缩，最后通过自动化评估持续迭代。

Agent 卡死 = 无限循环 / 工具调用失败 / 思考停滞 / 格式解析错误

面试标准回答：

Agent 卡死主要来自无限循环、工具异常、格式解析失败。解决方案包括：设置最大执行步数、工具调用异常捕获、强化输出格式校验与容错、增加循环检测、状态监控超时退出，确保流程可终止。

幻觉 = 模型编造信息、无中生有、瞎编结论

面试标准回答：

降低幻觉核心是让模型"有依据说话"：通过 RAG 提供真实资料，用 Prompt 强制禁止编造，通过高质量检索保证依据可靠，再增加事实校验环节，从源头杜绝无依据生成。

工具调度 = Agent 该在什么时候、调用哪个工具、怎么选最优路径

面试标准回答：

工具调度包括工具描述、路由选择、参数生成、执行解析、流程控制。通过清晰的工具描述让模型理解能力，用路由策略选择合适工具，支持串行/并行/条件执行，并增加异常重试与降级机制，保证稳定可用。

长上下文 = 文档太长、对话太长、模型装不下、注意力漂移

面试标准回答：

长上下文处理采用分块检索、动态压缩、分层记忆策略：长文档切分后只召回相关片段，对话历史用摘要+向量库管理，结合动态窗口控制长度，在有限上下文内保留最有价值信息。