文章目录
- 个人情况
- [一面/技术面 1h](#一面/技术面 1h)
- [二面/技术面 1h](#二面/技术面 1h)
- [三面/HR面 20min](#三面/HR面 20min)
个人情况
先说一下个人情况:
- 学校情况:211本中9硕,本硕学校都一般,本硕都是计算机科班,但研究方向并不是NLP,而是图表示学习
- 论文情况:1A(NeurIPS)+1B(ICDM)已录用,还有一篇A会(AAAI 2025)最近快出结果了,以及一篇数据挖掘A刊TOIS在投,四篇论文都是一作
- 实习情况:快手推荐算法日常实习 + 腾讯大模型暑期实习
- 奖学金情况:本科生国家奖学金、研究生国家奖学金,4次校级一等奖学金
- 其他:我的CSDN等平台有一点粉丝量,至于其他诸如数学建模还有蓝桥杯获奖,以及优秀毕业论文和优秀毕业生之类的,对求职也没太大作用
阿里今年秋招hc基本都只给转正,招人很少,形势不太好,大模型领域更是如此了,面了几家基本也都是走个过场,毕竟不是大模型科班出身,还是差了点
阿里这边只有斑马走完流程拿到了offer,阿里旗下一个做汽车科技的独角兽企业,目前等待开奖
一面/技术面 1h
- 自我介绍
- 介绍大模型实习
- 应用场景是什么,有什么意义
- 构造SFT数据的细节
- SFT的prompt模板
- 目前的方案有没有什么创新的地方
- 后续有没有什么改进,具体介绍一下
- 效果如何评估
- 大模型SFT过程中自己有没有什么总结出来的经验
- SFT过程中如何判断是否过拟合
- 硕士期间发表的paper,可以结合ppt来介绍一下
- 如何看待目前大语言模型都是decoder-only结构
- encoder-only和decoder-only的对比,纯理解场景哪个更优
- 描述一下典型的encoder-only如Bert的结构细节
- 多层堆叠时如何避免梯度消失和梯度爆炸
- DPO和PPO
- 代码题:lc75,颜色分类
二面/技术面 1h
- 自我介绍
- 询问转正情况
- 介绍大模型实习,具体负责了哪些板块
- 为什么没有公司内部的LLM
- 为什么非得用长文本而不用RAG
- 为什么不用GPT-4
- prompt优化这部分做了什么工作
- prompt优化这部分还了解哪些方法吗
- 如何判断当前使用的prompt就是最优的,无法进一步调整了
- 不做全量微调的原因(还能什么原因,没卡)
- SFT的资源描述,卡数,机器数
- SFT过程中如何判断是否过拟合
- 有没有系统学过机器学习课程,开始拷问八股
- 如何判断一个模型是否收敛,从多个角度回答
- 判断收敛需要用验证集吗
- 如何定量判断是否收敛
- 如何判断目前的收敛点是局部最优解还是全局最优解
- 测试集为什么一定需要存在,亦或者为什么不直接把验证集测试集合在一起
- 主要使用什么语言(Python),有没有系统学过C++
- C++中STL中一些容器的底层实现原理
- pytorch中的计算图
- 最近看的一些开源代码和paper介绍,有没有学到什么东西
- 对第一份工作的预期,希望加入什么团队
- 反问:进来后可能会做的方向
三面/HR面 20min
- 自我介绍
- 询问高考成绩,成绩排名
- 保研学校抉择问题
- 硕士期间在专业方向上的产出介绍
- 大概介绍了下论文
- 介绍大模型实习
- 实习对自己的提升是什么
- 针对本次面试的岗位,你觉得自己有哪些优势
- 平时通过什么途径来学习新东西
- 周围人/自己如何评价自己,优缺点
- 职业规划
- 反问:后续流程