精选20个大模型高频面试题

我精选20个大模型高频面试题,分享给大家

  1. 简述GPT和BERT的区别
  2. 讲一下GPT系列模型是如何演进的?
  3. 为什么现在的大模型大多是decoder-only的架构?
  4. 讲一下生成式语言模型的工作机理
  5. 哪些因素会导致LLM的偏见?
  6. LLM中的因果语言建模与掩码语言建模有什么区别?
  7. 如何减轻LLM中的幻觉现象?
  8. 解释ChatGPT的零样本和少样本学习的概念
  9. 你了解大型语言模型中的哪些分词技术?
  10. 如何评估大语言模型(LLMs)的性能?
  11. 如何缓解LLMs重复读问题?
  12. 请简述Transformer基本原理
  13. 为什么Transformer的架构需要多头注意力机制?
  14. transformers需要位置编码吗?
  15. transformer中,同一个词可以有不同的注意力权重吗?
  16. Wordpiece与BPE之间的区别是什么?
  17. 有哪些常见的优化LLMs输出的技术?
  18. GPT-3拥有的1750亿参数,是怎么算出来的?
  19. 温度系数和top-p,top-k参数有什么区别?
  20. 为什么transformer块使用LayerNorm而不是BatchNorm?

用通俗易懂的方式讲解系列

相关推荐
字节跳动_离青21 分钟前
智能的路径
人工智能
王上上31 分钟前
【论文阅读28】-CNN-BiLSTM-Attention-(2024)
论文阅读·人工智能·cnn
aichitang202432 分钟前
矩阵详解:从基础概念到实际应用
线性代数·算法·矩阵
Channing Lewis43 分钟前
如果科技足够发达,是否还需要维持自然系统(例如生物多样性)中那种‘冗余’和‘多样性’,还是可以只保留最优解?
大数据·人工智能·科技
禺垣43 分钟前
区块链技术概述
大数据·人工智能·分布式·物联网·去中心化·区块链
IT科技那点事儿1 小时前
引领AI安全新时代 Accelerate 2025北亚巡展·北京站成功举办
人工智能·安全
新智元1 小时前
美 IT 业裁员狂飙 35%,「硅谷梦」彻底崩塌!打工人怒喷 PIP
人工智能·openai
新智元1 小时前
乔布斯挚友去世!胰腺癌再夺硅谷天才,曾写下苹果「创世代码」
人工智能·openai
春末的南方城市1 小时前
中山大学&美团&港科大提出首个音频驱动多人对话视频生成MultiTalk,输入一个音频和提示,即可生成对应唇部、音频交互视频。
人工智能·python·深度学习·计算机视觉·transformer
春末的南方城市1 小时前
Ctrl-Crash 助力交通安全:可控生成逼真车祸视频,防患于未然
人工智能·计算机视觉·自然语言处理·aigc·音视频