面了唯品会 NLP 算法岗,这次学到了很多!

节前,我们组织了一场算法岗技术&面试讨论会,邀请了一些互联网大厂同学、参加社招和校招面试的同学,针对大模型技术趋势、大模型落地项目经验分享、新手如何入门算法岗、该如何备战、面试常考点分享等热门话题进行了深入的讨论。

今天整理我们社群一个同学面试唯品会 NLP 算法方向的面试题,分享给大家,希望对后续找工作的有所帮助。喜欢记得点赞、收藏、关注。更多技术交流&面经学习,可以加入我们。

  1. 目前实习工作, 为什要用聚类来评估文本向量化表示?
  2. DBSCAN算法原理(简历有)
  3. 生成模型的的Category不存在预定义集合怎么办
  4. UIE+Category具体流程 (实习)
  5. 分类评估用的是什么指标
  6. bert模型中文本到id转化的过程是怎么样?
  7. 现有流行的模型相对于transformer,多头注意力有哪些改进/不同
  8. 现有流行的模型相对于transformer,layernorm 层改进/不同
    a. 正态度分布
  9. 现有流行的模型相对于transformer,embedding的改进/不同
  10. 现有模型之间(chatglm baichuan llama)的不同主要是哪些方面
  11. 常见的高效微调方法有哪些(p-tuning v1/v2 prompt-tuning prefix_tuning), 他们是如何做到节省GPU的,GPU上存放的是什么
  12. 怎么进行梯度更新的, 有哪些优化函数
  13. 现有流行的各个模型的编码方法有了解吗, 有什么不同呢, 简单介绍一下
  14. ChatGLM和transformer在编码和注意力方面有哪些区别
  15. Lora的降秩是所有都降吗, 还是降哪些?
  16. 一般用高效微调来干嘛
  17. 序列标注有了解吗, CRF有了解吗
  18. 场景题 现有三个词 权重分别是0.2 0.3 0.5 可以使用random, 进行k次(亿级别)采样, 设计一个采样算法

反问

高效微调, GPU是如何存储的?1. 优化参数 2. 梯度参数 3. 模型参数

总结

面试官人挺好的 和之前面试的感觉不一样 面试过程可以学到很多东西。

还是自己太菜了 还是得练得沉淀

技术交流群

前沿技术资讯、算法交流、求职内推、算法竞赛、面试交流(校招、社招、实习)等、与 10000+来自港科大、北大、清华、中科院、CMU、腾讯、百度等名校名企开发者互动交流~

我们建了算法岗技术与面试交流群, 想要进交流群、需要源码&资料、提升技术的同学,可以直接加微信号:mlc2060。加的时候备注一下:研究方向 +学校/公司+CSDN,即可。然后就可以拉你进群了。

方式①、微信搜索公众号:机器学习社区,后台回复:加群

方式②、添加微信号:mlc2060,备注:技术交流

用通俗易懂方式讲解系列

相关推荐
火山引擎开发者社区4 小时前
没有长期记忆,Agent 谈何持续进化?一图看懂火山 Mem0:解锁 Agent 持续学习与进化之路
人工智能
冬奇Lab7 小时前
Workflow 系列(06):安全——跨步骤注入传播与四层防御
人工智能·工作流引擎
冬奇Lab7 小时前
每日一个开源项目(第149篇):RAG-Anything - 把图片、表格、公式当成一等公民的多模态 RAG 框架
人工智能·开源
米小虾7 小时前
AI Agent 安全实战指南:当智能体开始"不听话",开发者该如何应对?
人工智能·安全·agent
IT_陈寒9 小时前
Vite的热更新突然不香了,排查三小时差点砸键盘
前端·人工智能·后端
阿里云大数据AI技术11 小时前
构建高转化海外电商搜索:阿里云OpenSearch行业算法版的全链路智能优化策略实战
人工智能·搜索引擎
Awu122711 小时前
⚡从零开发 Agent CLI(五)实现一个可治理、可扩展的工具系统
前端·人工智能·claude
字节跳动视频云技术团队11 小时前
让 Agent 成为音视频工作台:AI MediaKit CLI + Skill 发布
人工智能·音视频开发
魏祖潇11 小时前
framework 整合实战——DDD/TDD/SDD 三件套在 framework 仓的真实落地
人工智能·后端