京东科技大模型RAG岗三轮面试全复盘：从八股到开放题的通关指南

京东科技大模型 RAG 岗三轮面试全复盘：从八股到开放题的通关指南

在大模型技术落地加速的当下，RAG（检索增强生成）作为连接模型与真实世界知识的核心技术，已成为企业招聘的热门方向。近期，我参与了京东科技人机交互技术部大模型 RAG 岗位的面试，历经三轮考核最终完成流程。整体面试难度适中，时长均控制在 1 小时内，且各轮侧重点清晰 ------ 从基础八股到项目深挖，再到开放题考察思维深度，层层递进却无超纲内容。现将完整面试经历与复盘思路整理如下，供同方向求职者参考。

一面：聚焦项目细节，基础八股 "热身"

一面时长约 40 分钟，整体节奏偏 "稳"，核心是通过项目验证候选人的实操能力，同时用基础问题确认技术栈匹配度。开场后，面试官先让我做自我介绍，随后直接跳过论文细节，将重心放在实习中的 RAG 项目上 ------ 这与面试官提及 "团队正做 RAG" 的背景直接相关，也提示了京东科技对 "项目落地经验" 的重视。

在项目提问环节，面试官围绕 "数据处理流程""检索策略选择""效果优化方法" 三个维度展开。比如 "为何选择 BM25 + 向量检索的混合策略？""召回结果冗余时做了哪些去重处理？""如何评估检索准确率与生成相关性？" 等问题，均需结合具体实操细节回答，而非泛泛而谈理论。这也提醒求职者：简历中提及的 RAG 项目，必须梳理清楚 "每一步决策的原因" 与 "对应的数据支撑"，避免因 "流程化描述" 被质疑实操能力。

基础技术问题则以 "八股题" 为主，难度不高但覆盖核心知识点。其中，"以 Qwen 为例讲 Decoder-only 架构构建""为何更倾向 Decoder-only 而非 Encoder-Decoder""大模型解码策略对比" 三个问题，均是大模型领域的基础考点。以 Decoder-only 架构为例，我从 "层结构设计"（多头注意力 + 前馈网络的堆叠）、"预训练目标"（自回归语言建模）、"Qwen 的优化点"（动态位置编码、分组查询注意力 GQA 的引入）三个层面拆解，既贴合具体模型，又展现了对架构细节的理解。而 "Decoder-only 更受欢迎" 的问题，需从 "生成任务适配性"（自回归生成天然匹配对话、文本创作场景）、"工程效率"（无需 Encoder，训练与推理成本更低）、"效果迁移性"（预训练模型易适配多任务）三个角度作答，才能覆盖技术与业务双重需求。

代码题考察的是 "148. 排序链表"，属于中等难度的链表操作题。面试官要求先讲思路再写代码，重点关注 "时间复杂度优化"（如归并排序的 O (nlogn) 方案）与 "边界条件处理"（空链表、单节点链表）。这类基础算法题，本质是考察候选人的代码基本功，提前刷 LeetCode 热题即可应对。

二面：深化技术深度，拓展 RAG 认知边界

二面时长不足 1 小时，在一面基础上进一步深化技术考察，尤其注重候选人对 "RAG 进阶方案" 与 "大模型优化技术" 的了解程度。开场同样是自我介绍与项目复盘，但面试官对论文细节的关注度有所提升，会追问 "论文的创新点与现有研究的差异""实验数据的可靠性验证方法"，这提示求职者需对自己的学术经历做深度梳理，避免 "论文只挂名、无理解" 的情况。

核心提问环节聚焦两大方向：一是 RAG 的进阶方案，二是大模型的工程优化技术。当被问及 "除了朴素 RAG 范式，还了解哪些改进方法" 时，我从 "检索层优化"（如多轮检索、跨模态检索、知识图谱增强检索）、"生成层优化"（如提示工程优化、检索结果重排序、多源信息融合）、"反馈层优化"（如用户反馈迭代检索策略、强化学习优化生成质量）三个维度展开，结合具体案例（如 LangChain 的多轮检索框架、Milvus 的向量索引优化）增强说服力，这也成为后续沟通的加分项。

关于大模型技术的提问，"GQA 原理""FlashAttention 优化思路""LoRA 及其改进方法" 三个问题，均是工程落地中的核心技术。例如 FlashAttention 的优化，需从 "内存访问效率"（将注意力计算拆分为块，减少显存读写）、"数值计算优化"（利用 GPU 硬件特性做并行计算）、"精度权衡"（在部分场景下用 FP16 替代 FP32，兼顾速度与精度）三个层面解释，才能体现对底层原理的理解；而 LoRA 的改进方法，可提及 "QLoRA（量化 LoRA，降低显存占用）""LoRA+（动态调整秩适应不同任务）""AdaLoRA（自适应分配参数更新权重）" 等，展现技术视野的广度。

代码题考察 "56. 合并区间"，属于数组操作的经典题，重点在于 "排序后贪心合并" 的思路，以及 "边界条件（如空数组、单个区间）" 的处理。面试官不仅关注代码正确性，还会追问 "时间复杂度能否进一步优化"，需明确 "排序 O (nlogn) 为最优，无法再降"，体现对算法复杂度的认知。

三面：聚焦 RAG 深度思考，开放题考察潜力

三面是终面，时长同样较短，但风格与前两轮差异明显 ------ 几乎不考八股题，全程围绕 "RAG 的深度思考" 与 "开放题" 展开，核心是评估候选人的问题解决能力与技术前瞻性。开场后，面试官让我 "挑一个最满意的论文或实习项目详细讲解"，并在过程中不断追问 "决策背后的逻辑"，比如 "为何选择这个技术方案而非其他？""遇到效果瓶颈时如何排查问题？""最终效果如何量化评估？"，这要求求职者对项目有 "从 0 到 1" 的完整认知，而非仅记忆流程。

当被指出 "RAG 项目比较简单" 时，我并未回避，而是主动提出 "后续改进思路"：一是 "检索精度优化"，计划引入知识图谱构建领域词典，解决专业术语检索不准的问题；二是 "生成相关性提升"，通过微调模型学习 "检索结果与生成文本的对齐策略"，减少 "答非所问"；三是 "效率优化"，利用量化技术降低检索与生成的 latency，适配实时场景。这种 "正视不足 + 主动规划" 的态度，得到了面试官的认可。

"RAG 如何保证检索内容符合用户期待" 与 "RAG 系统的改进方向" 两个开放题，是三面的核心。对于前者，我从 "用户需求理解"（通过多轮对话明确用户意图，细化检索关键词）、"检索策略适配"（根据用户场景选择不同检索方式，如精准匹配用于事实查询、模糊匹配用于创意生成）、"反馈机制"（建立用户评分体系，迭代优化检索结果）三个角度作答；对于后者，我则聚焦 "多模态 RAG 的落地"（如处理图片、表格类信息）、"低资源场景下的 RAG 优化"（如小样本学习减少数据依赖）、"隐私保护 RAG"（如联邦检索、本地化部署）三个方向，结合京东科技的业务场景（如电商客服、智能导购）提出具体改进设想，让回答更具落地性。

面试总结与备考建议

回顾三轮面试，京东科技大模型 RAG 岗的考察特点清晰：重项目实操、轻偏难怪题、注业务落地。结合我的经历，给同方向求职者三点建议：

深耕 RAG 项目细节：简历中提及的 RAG 项目，需梳理 "数据流程、技术选型、效果优化、问题排查" 全链路，尤其要准备 "为何做这个决策""如果重来会如何改进" 等深度问题，避免 "流程化背书"。
拓展技术视野广度：除了基础的 RAG 范式，需了解 "多轮检索、知识图谱增强、LoRA 微调、FlashAttention 优化" 等进阶技术，可通过阅读顶会论文（如 NeurIPS、ICML）、开源项目（如 LangChain、Milvus）提升认知。
结合业务思考问题：面试中遇到开放题，需结合企业业务场景（如京东的电商、客服场景）提出解决方案，避免 "纯技术空谈"，体现 "技术服务业务" 的思维。

整体而言，京东科技大模型 RAG 岗的面试难度适中，只要扎实掌握基础技术、深入理解项目细节、具备一定的技术视野，通关概率较高。希望我的复盘能为同方向求职者提供参考，祝大家都能拿到心仪的 offer！