山东大学2024深度学习期末考试回忆

2024.6.17考

整体来说比往年难了些,没有考计算图。LSTM看上去必考了,LSTM的图一定要会画。

名词解释(24分,一个3分)

分布式表示

超参数

共现矩阵

截断BPTT

attention机制

梯度确认

语言模型

困惑度

简答题(48分,一个8分)

1.简述训练数据、测试数据、验证数据的作用,为什么要划分训练数据测试数据

2.为什么激活函数不能使用非线性激活函数

3.为什么dropout能抑制过拟合

4.简述神经网络的学习过程

5.简述batch normalization的三个优点

6.word2vec计算哪里有瓶颈,给出方法减小计算量

综合分析(28)

一、

1.计算全连接层,给一张256*256的输入图像,只有一个隐藏层,隐藏层有10个神经元,输出层有1000个神经元,在不考虑偏置的情况下,参数数量是多少,给出计算过程(6分)

2.卷积神经网络的特点(3分)

3.随机梯度下降低效的根本原因,给出除随机梯度下降以外的3种参数更新方法(4)

二、

1.画出LSTM的内部图(5)

2.LSTM三个门的作用(5)

3.改进RNNLM的三个措施(5)

相关推荐
程序猿阿伟9 分钟前
《AI赋能鸿蒙Next,打造极致沉浸感游戏》
人工智能·游戏·harmonyos
遇健李的幸运25 分钟前
深入浅出:Agent如何调用工具——从OpenAI Function Call到CrewAI框架
人工智能
天天讯通27 分钟前
AI语音机器人大模型是什么?
人工智能·机器人
说私域34 分钟前
微商关系维系与服务创新:链动2+1模式、AI智能名片与S2B2C商城小程序的应用研究
人工智能·小程序
人机与认知实验室1 小时前
人-AI协同如何重塑未来战争?
人工智能
学技术的大胜嗷1 小时前
小目标检测难点分析和解决策略
人工智能·目标检测·计算机视觉
李加号pluuuus1 小时前
【论文阅读+复现】High-fidelity Person-centric Subject-to-Image Synthesis
论文阅读·人工智能·计算机视觉
XianxinMao1 小时前
o3模型重大突破:引领推理语言模型新纪元,展望2025年AI发展新格局
人工智能·语言模型
martian6652 小时前
深入详解人工智能自然语言处理(NLP)之文本处理:分词、词性标注、命名实体识别
人工智能·自然语言处理
HyperAI超神经2 小时前
微软与腾讯技术交锋,TRELLIS引领3D生成领域多格式支持新方向
人工智能·深度学习·机器学习·计算机视觉·3d·大模型·数据集