大语言模型面试心路历程【0 offer版】

记录自己大语言模型面试的经历,旨在可以帮助更多想要从事此方面的小伙伴。

北银金科

1.InstructGPT的训练过程

2.critic网络的作用

3.LSTM的原理,GRU与LSTM有什么不同

4.讲一下Bert的结构

5.讲一下自己的论文【KBQA相关】

6.GLM的结构和微调了哪些参数

7.LoRA和P-tuning的原理分别是什么

8.还了解哪些参数微调的方法

9.GLM和baichuan之间的比较

10.检索增强式大模型的理解

11.快速排序

12.计算单词的编辑距离

好未来

1.算法题977. 有序数组的平方

2.算法题 快速排序

3.算法题 按字典中value数组中第一个值进行排序

4.Transformer中self-attention的计算公式 为什么除以dk

5.为什么用多头注意力机制

6.大模型在多头注意力机制方面有哪些改进

7.微调过什么大模型

8.self-instruct如何根据种子数据集生成数据

9.P-tuning、Prefix tuning、LoRA的原理 隐式token向量是什么 怎么产生的

10.SGD的原理 一阶导数二阶导数

相关推荐
神奇小汤圆9 分钟前
Miller Rabin:概率之下,证据成群
面试
贺国亚26 分钟前
RAG 检索增强 · 向量库与 Chunking
后端·面试
wabs66632 分钟前
本科毕业设计项目——基于RAG与大语言模型的408问答系统设计与实现【用户端的提问逻辑是怎么实现的?】
人工智能·语言模型·自然语言处理
DS随心转APP33 分钟前
2026年AI对话导出Word完全指南|ChatGPT/DeepSeek/豆包/Claude一键转换–AI导出鸭
人工智能·ai·chatgpt·豆包·deepseek·ai导出鸭
weixin_4462608536 分钟前
SpecBench:软件工程中大型语言模型智能体的规范级推理评估
人工智能·语言模型·软件工程
Raink老师39 分钟前
【AI面试临阵磨枪-84】如何看待 RAG vs 微调(Fine-tuning)?选型依据
人工智能·面试·职场和发展
暗不需求42 分钟前
React 性能优化秘籍:深入理解 `useMemo` 与 `useCallback`
前端·react.js·面试
better_liang1 小时前
每日Java面试场景题知识点之-数据库与缓存的一致性
java·数据库·redis·面试·分布式系统·缓存一致性·cache aside
JAVA社区1 小时前
Java高级全套教程(九)—— SpringCloud超详细实战详解
java·开发语言·后端·spring cloud·面试·职场和发展
学代码的真由酱1 小时前
【自用】测开面试问题-Java
java·面试·职场和发展