大家好,我是小林。
如果你在准备 2026 的 AI 岗面试,先把这个网站收藏了:
👉 小林面试笔记:https://xiaolinnote.com
专注 AI Agent 开发方向的面试题网站,图解 Agent + RAG + LLM 面试题,让一部分人先跑赢 AI Agent 开发面试。
为什么值得你专门收藏一个网站?我先把家底亮出来------这套大模型面试题目前已经沉淀了:
- 📚 74 道大厂真实高频面试题(Agent / RAG / 工具调用 / 大模型工程)
- 🖼️ 615 张纯手绘图解,复杂原理一张图看懂
- ✍️ 25 万+字详细答案解析,每题都讲到能自己推导
- 🆓 全部免费,且每月持续更新,紧跟 MCP、A2A 等新协议
而且每一道题都做了四件别的八股不会做的事:题目全部来自字节、阿里、腾讯等大厂真实面经 、开头先来一段「面试翻车现场」让你感受踩雷体验、复杂架构全部配手绘图解**、**从根子上把原理讲透------不是让你背答案,而是面试官怎么换着问你都能推出来。

大模型面试题:4 大专题,74 道题全部列给你
进入 2026,AI 岗面试的重心已经从「大模型基础」快速转向「AI 应用落地」,大模型面试题、Agent 面试题、AI 应用开发面试题成了应届和社招必刷的三大方向。下面 4 大专题的题目我全部列出来,点开任意一题都是一篇完整图解长文。

一、Agent 面试题(16 题 · 158 张图 · 6.4 万字)
📖 专题介绍与完整目录:Agent 面试题介绍页
2026 最火的方向,也是 Agent 面试题问得最深的一块。开放题「让你设计一个客服 Agent,任务怎么拆?记忆怎么存?工具调用失败怎么兜底?」全靠这 16 道题打底。

- 1. 什么是 Agent?与大模型有什么本质不同?
- 2. Agent 的基本架构由哪些核心组件构成?
- 3. Workflow,Agent,Tools 这三个的概念和区别介绍一下?
- 4. 了解哪些其他的 Agent 设计范式?Agent 和 Workflow 的区别是什么?
- 5. Agent 推理模式有哪些?ReAct 是啥?具体是怎么实现的?
- 6. ReAct、Plan-and-Execute、Reflection 三种范式有什么核心区别?实际项目中该如何选型?
- 7. 复杂任务怎么做的任务拆分?为什么要拆分?效果如何提升?
- 8. 请你介绍一下 AI Agent 的记忆机制,并说明在实际开发中应该如何设计记忆模块?
- 9. Agent 的长短期记忆系统怎么做的?记忆是怎么存的?粒度是多少?怎么用的?
- 10. 什么是 Multi-Agent?
- 11. 说说 Single-Agent 和 Multi-Agent 的设计方案?
- 12. Agent 记忆压缩通常有哪些方法?
- 13. 在工程实践中,为什么有时候选择「手搓」Agent,而不是直接用成熟框架?
- 14. 如何赋予 LLM 规划能力?
- 15. 讲讲 Agent 的反思机制?为什么要用反思?具体怎么实现?
- 16. 如何设计多 Agent 的协作与动态切换机制?
二、RAG 面试题(20 题 · 142 张图 · 6 万字)
📖 专题介绍与完整目录:RAG 面试题介绍页
RAG 是 Agent 面试题与 AI 应用开发面试题的共同基础,几乎每家大厂必问,建议第一个吃透。这 20 道把 RAG 从原理到线上落地完整过一遍。

- 1. 什么是 RAG?详细描述一个完整 RAG 系统的详细工作流程?
- 2. 大模型的 RAG 主要用来解决什么问题?
- 3. 相比直接微调 LLM,RAG 解决了什么问题?微调和 RAG 各自的优劣势是什么?
- 4. RAG 中的文档是怎么存的?粒度是多大?详细说说文档切割(Chunking)策略?
- 5. 怎么规避语义被切割掉的问题?
- 6. 在 RAG 中 Embedding 究竟是什么?如何选择和评估一个 Embedding 模型?
- 7. Embedding 有哪几种算法你了解过吗?
- 8. 什么是向量数据库?有没有做过向量数据库的对比选型?
- 9. 讲讲你用的向量数据库?数据量级是多大?性能如何?遇到过性能瓶颈吗?
- 10. 你使用 RAG 给大模型一个输入,系统是怎样的工作流程?
- 11. 请你介绍一下向量检索和关键词检索的区别?
- 12. 如何润色用户的 Query(Query Rewrite)?目的是什么?
- 13. 什么是多路召回?具体怎么做?
- 14. RAG 检索优化策略有哪些?
- 15. 了解哪些更复杂的 RAG 范式?
- 16. 在什么场景下,你会选择使用图数据库来增强传统的向量检索?
- 17. 如何规避 RAG 系统中大模型的幻觉?
- 18. 怎么量化你的 RAG 效果?
- 19. RAG 知识库如何实现动态与持续更新?
- 20. 在实际落地中,你觉得 RAG 最难的地方是哪里?
三、LLM 工具调用面试题(16 题 · 127 张图 · 4.6 万字)
📖 专题介绍与完整目录:LLM 工具调用面试题介绍页
这是 AI 应用开发面试题的核心场景。2026 一线大厂已经把 MCP 写进 JD,Function Calling 的 Schema 设计、工具调用失败重试、SSE 与 WebSocket 选型答不好,送分题就成了送命题。

- 1. 什么是 Function Calling?原理是什么?
- 2. LLM 是如何学会调用外部工具的?
- 3. 大模型的 Function Call 能力是怎么训练出来的?
- 4. 什么是 MCP(模型上下文协议)?讲讲它的核心内容?
- 5. MCP 由哪几部分组成?
- 6. MCP 和 Function Calling 有什么区别?有没有实际跑过 MCP?
- 7. Function Calling 也属于工具调用,请问什么场景下使用 Function Calling,什么场景下使用 MCP?
- 8. 为什么有些特定的推理模型不支持 MCP 协议?
- 9. Skill 是什么?
- 10. MCP 和 Agent Skill 的区别是什么?
- 11. Function Calling、Skill、MCP 这三个有什么区别?
- 12. 什么是 A2A 协议?它和 MCP 协议的区别是什么?
- 13. MCP 协议通常采用什么通信方式?
- 14. 说说 WebSocket 和 SSE 通信的区别及局限性?
- 15. 为什么要用 WebRTC 协议?它和 WebSocket 在 AI 对话流中的核心差异是什么?
- 16. 有没有用过大模型的网关框架?网关层解决了什么问题?
四、大模型工程面试题(22 题 · 188 张图 · 8.1 万字)
📖 专题介绍与完整目录:大模型工程面试题介绍页
大模型面试题的工程深水区,P6+ 算法岗与推理工程岗的高频加试。专门聚焦「模型在生产环境为什么跑不快、跑不稳、跑不省成本」这类高阶追问。

- 1. 什么是大语言模型?和传统 NLP 模型有什么区别?
- 2. 讲讲 Transformer 架构基本原理?Encoder 和 Decoder 是什么?
- 3. 多头注意力(MHA)有哪些局限?MQA、GQA、Flash Attention 怎么解决?
- 4. 大模型的位置编码是干什么用的?sin/cos、RoPE、ALiBi 有什么区别?
- 5. 什么是大模型项目的分词器?原理是什么?
- 6. 大模型是怎么训练出来的?
- 7. 什么是 Scaling Law?大模型的「涌现能力」是怎么回事?
- 8. 大模型微调的方案有哪些?
- 9. 请讲一下 LoRA 技术,除了减少参数量,它还有哪些优点?
- 10. SFT 之后还有哪些 Post-Training?RLHF、DPO、GRPO、拒绝采样什么关系?
- 11. 大模型的 DPO 和 PPO 的区别是什么?
- 12. 大模型生成文本时的解码策略有哪些?贪心、Beam Search、采样分别什么时候用?
- 13. 大模型的参数:温度值、Top-P、Top-K 分别是什么?各个场景下的最佳设置是什么?
- 14. KV Cache 是什么?Prompt Caching 的原理是什么?
- 15. 大模型量化是什么?INT8/INT4/AWQ/GPTQ 怎么选?
- 16. 如何写好 Prompt?分享下 Prompt 工程实践经验?
- 17. 什么是 CoT?为啥效果好?它有什么缺点或局限性?
- 18. 大模型为什么会出现幻觉?怎么缓解?
- 19. MoE 混合专家模型是什么?DeepSeek V3、Qwen 为什么用 MoE?
- 20. 大模型部署有哪些主流方案?vLLM、TGI、llama.cpp、SGLang 实际项目里怎么选?
- 21. 大模型能力评测指标有哪些?
- 22. 对比使用过哪些主流大模型?你们项目中最终选用了哪个模型?为什么?
此外还有《LangChain 框架面试题》专题持续更新中。完整大模型面试题入口:https://xiaolinnote.com/ai/
进阶专栏:图解 Agent & 图解 Claude Code
逐题八股能让你「会答题」,但想真正「懂原理」、在面试官连环追问下不慌,还得看这两个**「一文讲透」**的图解专栏。和八股不同,这里每篇都是一个主题的万字长文,把来龙去脉、设计取舍、源码细节一次性讲穿------这也是网站和其他面试题站点最不一样的地方。
🤖 图解 Agent:吃透 AI 智能体的前沿与底层(6 篇万字长文)
不只是面试题,而是带你看懂当下最火的 Agent 概念、生态与工程方法论。很多内容是全网少有人讲透的前沿话题:

- 👉AI Agent 是什么?:从 0 讲清 Agent 与 LLM 的本质区别、四大核心模块,以及 MCP / A2A 协议,新手入门第一篇。
- 👉OpenClaw 是什么?:GitHub 一度霸榜的爆火开源 Agent,扒一遍它到底凭什么火、架构怎么设计。
- 👉RAG 是什么?:让大模型不再「一本正经胡说八道」的核心技术,一篇看懂检索增强全流程。
- 👉GraphRAG 和 LightRAG 详解:传统 RAG 撞墙之后的两条进阶路线,原理、对比与选型一次说清。
- 👉Harness Engineering 是什么?:被 OpenAI 官方验证的「让 AI Agent 越用越聪明、不再重复犯错」的工程方法论。
- 👉Loop Engineering 是什么?:Claude Code 作者那句「我的工作就是写 loop」背后,AI 编程从 Prompt 到 Loop 的范式转变。
💻 图解 Claude Code:从源码到实战,吃透最强编程 Agent(10 篇)
Claude Code 源码泄漏的 51 万行代码全网刷屏,越来越多大厂面试开始追问它的实现原理。这个专栏带你扒源码 + 练实战,是目前少有的成体系的 Claude Code 深度解析。

源码解析(6 篇)
- 👉源码总览:51 万行泄漏代码里的整体架构设计,先建立全局视角。
- 👉主循环 Query:一轮对话到底怎么跑起来的,异步生成器与 fake tool_result 全讲透。
- 👉上下文管理:Compact 自动压缩机制,长对话为什么不会爆上下文。
- 👉代码检索:为什么用 grep 而不用 RAG 检索代码------字节高频面试题。
- 👉记忆机制:为什么偏偏不上向量数据库,而用 CLAUDE.md + 文件系统。
- 👉多 Agent 机制:SubAgent 怎么拆任务、并发调度与上下文隔离。
实战技巧(4 篇)
- 👉基础使用技巧:新手入门必学,快速上手少走弯路。
- 👉/powerup 教程:官方内置的 18 个互动课程逐个过一遍。
- 👉CLAUDE.md 怎么写:项目记忆文件的正确维护姿势,别再堆上千行无效配置。
- 👉百万行大代码库实战:公司几百万行代码,Claude Code 怎么扛得住。
这份面试题合集适合谁?怎么搭配看?
先记住一条总原则:做 AI 应用开发,主看 Agent + RAG + LLM 工具调用三大专题;大模型工程面试题偏算法底层、难度更高,应用方向当进阶选看,算法 / 大模型自研方向当主线。
- 应届校招(投 AI 应用 / Agent 开发岗) :主攻 Agent 面试题 + RAG 面试题 + LLM 工具调用面试题,这三块就能覆盖 90% 的一面二面追问;大模型工程面试题里挑「应用相关」的(采样参数、Prompt、CoT、幻觉、KV Cache、部署选型)选看即可,训练对齐那部分可以先跳过。
- 后端 / 算法转 AI 应用开发 :已有工程底子,缺的是 AI 落地范式------按 Agent → RAG → LLM 工具调用(MCP、网关) 的顺序补,最快补齐应用层短板。
- AI 应用工程师(社招) :把 Agent + RAG + 工具调用三块往深里抠(Multi-Agent 协作、Agent 可观测性、成本与并发、幻觉规避、MCP / 网关治理),冲 P6 / P7 深水区。
- 算法 / 推理 / 大模型开发工程师(非应用层) :大模型工程面试题才是你的主战场------Transformer、Flash Attention、RoPE、LoRA、RLHF / DPO / GRPO 对齐、量化、MoE、推理部署这些底层硬骨头,难度最高,是算法岗与大模型自研岗的核心考点;Agent 与 RAG 作为加分项。
常见问题 FAQ
AI 应用开发面试主要考什么? 主要考三块:Agent (架构、ReAct、任务拆分、记忆、Multi-Agent 协作)、RAG (切割、Embedding、向量库、检索优化、Rerank)、LLM 工具调用(Function Calling、MCP、A2A、网关治理)。这三块对应网站的 Agent / RAG / 工具调用三大专题,是应用方向的必刷重点。
大模型工程面试题难吗?应用开发同学要看吗? 偏难,更偏算法底层(Transformer、Flash Attention、RoPE、LoRA、RLHF/DPO/GRPO、量化、MoE)。它更适合算法 / 推理 / 大模型自研方向的同学当主线;应用开发同学当进阶,挑「应用相关」的(采样参数、Prompt、CoT、幻觉、KV Cache、部署选型)选看即可。
大模型面试题和算法面试题有什么区别? 算法题考数据结构与系统设计,偏通用基础;大模型面试题聚焦 Transformer、注意力机制、训练推理优化、对齐方式等 LLM 专属知识。大厂 AI 岗两类都考,权重随岗位倾斜。
没有大模型项目经验,能学 Agent 面试题吗? 能。Agent 面试题的核心是工程思维(任务拆分、记忆机制、工具调用、失败处理),配合网站的图解和代码示例就能掌握,建议再搭一个 MVP 级 Agent Demo 写进简历。
这套大模型面试题要刷多久?怎么安排? 应用方向 1 个月足够:先 Agent,再 RAG,最后工具调用;每道题按「先看面试翻车现场 → 再看图解原理 → 合上网页自己复述」三步走,比死记硬背高效得多。
网站内容免费吗?会持续更新吗? 全部免费。题目每月更新,紧跟大厂 JD 与新协议(MCP、A2A、Skills、AG-UI 等),建议直接收藏 xiaolinnote.com 随用随查,春招提前 2 个月开始系统刷题。
结语
以上就是 2026 年最新的大模型面试题、Agent 面试题、AI 应用开发面试题三大方向合集。建议直接收藏网站作为面试备战主入口,随用随查:
👉 小林面试笔记:https://xiaolinnote.com ------ 大厂新题、新协议(MCP、A2A、AG-UI 等)第一时间更新,助你在 AI 岗招聘季跑赢多数候选人。