山东大学2024深度学习期末考试回忆

2024.6.17考

整体来说比往年难了些,没有考计算图。LSTM看上去必考了,LSTM的图一定要会画。

名词解释(24分,一个3分)

分布式表示

超参数

共现矩阵

截断BPTT

attention机制

梯度确认

语言模型

困惑度

简答题(48分,一个8分)

1.简述训练数据、测试数据、验证数据的作用,为什么要划分训练数据测试数据

2.为什么激活函数不能使用非线性激活函数

3.为什么dropout能抑制过拟合

4.简述神经网络的学习过程

5.简述batch normalization的三个优点

6.word2vec计算哪里有瓶颈,给出方法减小计算量

综合分析(28)

一、

1.计算全连接层,给一张256*256的输入图像,只有一个隐藏层,隐藏层有10个神经元,输出层有1000个神经元,在不考虑偏置的情况下,参数数量是多少,给出计算过程(6分)

2.卷积神经网络的特点(3分)

3.随机梯度下降低效的根本原因,给出除随机梯度下降以外的3种参数更新方法(4)

二、

1.画出LSTM的内部图(5)

2.LSTM三个门的作用(5)

3.改进RNNLM的三个措施(5)

相关推荐
程序猿追12 分钟前
异腾910B NPU实战:vLLM模型深度测评与部署指南
运维·服务器·人工智能·机器学习·架构
York·Zhang15 分钟前
Ollama:在本地运行大语言模型的利器
人工智能·语言模型·自然语言处理·ollama
reesn20 分钟前
nanochat大语言模型讲解一
人工智能·语言模型·自然语言处理
张较瘦_27 分钟前
[论文阅读] AI + 软件工程 | 3340个Python ML项目实证:PyQu工具+61种代码变更,精准提升软件质量!
论文阅读·人工智能·软件工程
m0_7482480230 分钟前
C++20 协程:在 AI 推理引擎中的深度应用
java·c++·人工智能·c++20
leafff1231 小时前
一文了解-大语言模型训练 vs 推理:硬件算力需求数据对比
人工智能·语言模型·自然语言处理
CareyWYR1 小时前
每周AI论文速递(251103-251107)
人工智能
AI科技星1 小时前
张祥前统一场论动量公式P=m(C-V)误解解答
开发语言·数据结构·人工智能·经验分享·python·线性代数·算法
cooldream20092 小时前
构建智能知识库问答助手:LangChain与大语言模型的深度融合实践
人工智能·语言模型·langchain·rag
antonytyler2 小时前
机器学习实践项目(二)- 房价预测增强篇 - 模型训练与评估:从多模型对比到小网格微调
人工智能·机器学习