【深度学习】神经网络术语:Epoch、Batch Size和迭代

batchsize:中文翻译为批大小(批尺寸)。

简单点说,批量大小将决定我们一次训练的样本数目。

batch_size将影响到模型的优化程度和速度。

为什么需要有 Batch_Size :

batchsize 的正确选择是为了在内存效率和内存容量之间寻找最佳平衡。

Batch_Size的取值:

全批次(蓝色)

如果数据集比较小我们就采用全数据集。全数据集确定的方向能够更好地代表样本总体,从而更准确地朝向极值所在的方向。

注:对于大的数据集我们不能使用全批次,因为会得到更差的结果。

迷你批次(绿色)

选择一个适中的 Batch_Size 值。就是说我们选定一个batch的大小后,将会以batch的大小将数据输入深度学习的网络中,然后计算这个batch的所有样本的平均损失,即代价函数是所有样本的平均。

随机(batch_size等于1的情况)(红色)

每次修正方向以各自样本的梯度方向修正,横冲直撞各自为政,难以达到收敛。

适当的增加Batchsize 的优点:

1.通过并行化提高内存利用率。

2.单次epoch的迭代次数减少,提高运行速度。(单次epoch=(全部训练样本/batchsize) / iteration =1)

3.适当的增加Batch_Size,梯度下降方向准确度增加,训练震动的幅度减小。(看上图便可知晓)

经验总结:

相对于正常数据集,如果Batch_Size过小,训练数据就会非常难收敛,从而导致underfitting。

增大Batch_Size,相对处理速度加快。

增大Batch_Size,所需内存容量增加(epoch的次数需要增加以达到最好结果)。

这里我们发现上面两个矛盾的问题,因为当epoch增加以后同样也会导致耗时增加从而速度下降。因此我们需要寻找最好的batch_size。

再次重申:batchsize 的正确选择是为了在内存效率和内存容量之间寻找最佳平衡。

Iteration: 中文翻译为迭代。

迭代是重复 反馈的动作,神经网络中我们希望通过迭代进行多次的训练以到达所需的目标或结果。

++每一次迭代得到的结果都会被作为下一次迭代的初始值。++

一个迭代 = 一个正向通过+一个反向通过

epoch:中文翻译为时期。

一个时期 = 所有训练样本的一个正向传递和一个反向传递。

相关推荐
DogDaoDao几秒前
【GitHub】TextGen:开源本地大模型运行平台的终极解决方案
人工智能·深度学习·自然语言处理·开源·大模型·github·textgen
逻辑君8 分钟前
认知神经科学研究报告【20260042】
人工智能·神经网络·机器学习
香蕉鼠片11 分钟前
模型训练微调流程,pytorch(豆包写的
pytorch·深度学习·机器学习
动物园猫13 分钟前
混凝土表面裂缝目标检测数据集分享(适用于YOLO系列深度学习分类检测任务)
深度学习·yolo·目标检测
huisheng_qaq35 分钟前
【AI入门篇-03】深入理解神经网络的实现原理
人工智能·rnn·深度学习·神经网络·ai·transformer
十铭忘38 分钟前
贝叶斯推断、隐马尔可夫模型、卡尔曼滤波
人工智能·深度学习·机器学习
绛橘色的日落(。・∀・)ノ38 分钟前
机器学习
人工智能·笔记·深度学习
众生皆苦,我是红豆奶茶味39 分钟前
【工具】Codex 配置文件速查笔记(截至 2026 年 05 月 09 日)
人工智能·笔记·python·深度学习·神经网络
美摄科技44 分钟前
GAN美颜SDK技术方案,用AI重新定义 “真实”!
人工智能·神经网络·生成对抗网络
机器视觉_Explorer14 小时前
【halcon】编程技巧:鼠标擦除
图像处理·人工智能·深度学习·算法·视觉检测