深度学习-批量与动量【Datawhale X 李宏毅苹果书 AI夏令营】

实际工程中使用批量和动量可以对抗鞍点或局部最小值。

批量:

在计算梯度的时候不会用所有数据计算损失。类比我们考试复习时,一个单元一个单元的知识点输入,所有单元都输入就是一整个轮回。而这一个单元用深度学习的术语来说就是批量(batch)。遍历所有批量就是一个回合(epoch)。

使用全批量的数据来更新参数的方法叫做批量梯度下降法(BGD),在下降的梯度上引入随机噪声,叫做随机梯度下降法(SGD)。

相对而言,大的批量更新比较稳定,小的批量梯度方向存在一定的噪声,有噪声的梯度反而可以帮助训练。

动量:

如果一个球从高处滚下来,由于惯性它会继续往前走,如果动量足够大,甚至可以翻越小坡继续走。这就是动量。简单些理解,在高处下落的球在滑落到局部最低的坡之后会继续往高处越,假如当前的高处有一个小坡,球还是可以越过这个小坡到达下一个最低点。

相关推荐
爱研究的小牛11 分钟前
ESRGAN——老旧照片、视频帧的修复和增强,提高图像的分辨率
人工智能·深度学习·自动化·aigc·音视频
ClonBrowser20 分钟前
社交媒体的未来:Facebook如何通过AI技术引领潮流
人工智能·媒体·facebook
chiikawa&q24 分钟前
(不用互三)解密AI创作:提升Prompt提示词的提问技巧
人工智能·prompt
E___V___E27 分钟前
yolov1到yolov5的发展
人工智能·yolo·目标跟踪
tangjunjun-owen1 小时前
kitti数据label的2d与3d坐标转为像素坐标方法与教程(代码实现)
人工智能·opencv·3d·3d目标检测·kitti·内参
使者大牙1 小时前
深度学习中的常用线性代数知识汇总——第一篇:基础概念、秩、奇异值
人工智能·pytorch·python·深度学习·线性代数
使者大牙1 小时前
深度学习中的常用线性代数知识汇总——第二篇:行列式、逆矩阵、特征值与特征向量
pytorch·python·深度学习·线性代数·矩阵
FL16238631291 小时前
[数据集][目标检测]男女性别检测数据集VOC+YOLO格式9769张2类别
深度学习·yolo·目标检测
稻谷君W1 小时前
docker构建镜像环境搭建深度学习开发环境
深度学习·docker·容器
猿类崛起@2 小时前
OpenAI o1预览模型发布:推理能力更强 可达理科博士生水准
人工智能·深度学习·ai大模型·大模型学习·大模型入门·大模型教程