面了唯品会 NLP 算法岗,这次学到了很多!

节前,我们组织了一场算法岗技术&面试讨论会,邀请了一些互联网大厂同学、参加社招和校招面试的同学,针对大模型技术趋势、大模型落地项目经验分享、新手如何入门算法岗、该如何备战、面试常考点分享等热门话题进行了深入的讨论。

今天整理我们社群一个同学面试唯品会 NLP 算法方向的面试题,分享给大家,希望对后续找工作的有所帮助。喜欢记得点赞、收藏、关注。更多技术交流&面经学习,可以加入我们。

  1. 目前实习工作, 为什要用聚类来评估文本向量化表示?
  2. DBSCAN算法原理(简历有)
  3. 生成模型的的Category不存在预定义集合怎么办
  4. UIE+Category具体流程 (实习)
  5. 分类评估用的是什么指标
  6. bert模型中文本到id转化的过程是怎么样?
  7. 现有流行的模型相对于transformer,多头注意力有哪些改进/不同
  8. 现有流行的模型相对于transformer,layernorm 层改进/不同
    a. 正态度分布
  9. 现有流行的模型相对于transformer,embedding的改进/不同
  10. 现有模型之间(chatglm baichuan llama)的不同主要是哪些方面
  11. 常见的高效微调方法有哪些(p-tuning v1/v2 prompt-tuning prefix_tuning), 他们是如何做到节省GPU的,GPU上存放的是什么
  12. 怎么进行梯度更新的, 有哪些优化函数
  13. 现有流行的各个模型的编码方法有了解吗, 有什么不同呢, 简单介绍一下
  14. ChatGLM和transformer在编码和注意力方面有哪些区别
  15. Lora的降秩是所有都降吗, 还是降哪些?
  16. 一般用高效微调来干嘛
  17. 序列标注有了解吗, CRF有了解吗
  18. 场景题 现有三个词 权重分别是[0.2 0.3 0.5] 可以使用random, 进行k次(亿级别)采样, 设计一个采样算法

反问

高效微调, GPU是如何存储的?1. 优化参数 2. 梯度参数 3. 模型参数

总结

面试官人挺好的 和之前面试的感觉不一样 面试过程可以学到很多东西。

还是自己太菜了 还是得练得沉淀

技术交流群

前沿技术资讯、算法交流、求职内推、算法竞赛、面试交流(校招、社招、实习)等、与 10000+来自港科大、北大、清华、中科院、CMU、腾讯、百度等名校名企开发者互动交流~

我们建了算法岗技术与面试交流群, 想要进交流群、需要源码&资料、提升技术的同学,可以直接加微信号:mlc2060。加的时候备注一下:研究方向 +学校/公司+CSDN,即可。然后就可以拉你进群了。

方式①、微信搜索公众号:机器学习社区,后台回复:加群

方式②、添加微信号:mlc2060,备注:技术交流

用通俗易懂方式讲解系列

相关推荐
云知谷1 小时前
【C++基本功】C++适合做什么,哪些领域适合哪些领域不适合?
c语言·开发语言·c++·人工智能·团队开发
电子_咸鱼2 小时前
LeetCode——Hot 100【电话号码的字母组合】
数据结构·算法·leetcode·链表·职场和发展·贪心算法·深度优先
仰泳的熊猫2 小时前
LeetCode:785. 判断二分图
数据结构·c++·算法·leetcode
rit84324992 小时前
基于MATLAB实现基于距离的离群点检测算法
人工智能·算法·matlab
初学小刘3 小时前
深度学习:从图片数据到模型训练(十分类)
人工智能·深度学习
递归不收敛3 小时前
大语言模型(LLM)入门笔记:嵌入向量与位置信息
人工智能·笔记·语言模型
my rainy days4 小时前
C++:友元
开发语言·c++·算法
haoly19894 小时前
数据结构和算法篇-归并排序的两个视角-迭代和递归
数据结构·算法·归并排序
微笑尅乐4 小时前
中点为根——力扣108.讲有序数组转换为二叉搜索树
算法·leetcode·职场和发展
之墨_4 小时前
【大语言模型】—— 自注意力机制及其变体(交叉注意力、因果注意力、多头注意力)的代码实现
人工智能·语言模型·自然语言处理