- 数据增强
定义:通过对原始图像进行随机变换(如旋转、翻转、裁剪、亮度调整等),生成更多 "新样本" 的技术。
作用:
(1)扩充数据集规模,缓解过拟合
(2)提升模型对图像变换的鲁棒性
- 卷积神经网络(CNN)定义的写法
CNN 的核心层包括卷积层、池化层、全连接层,需通过类继承nn.Module实现,示例如下:

- Batch 归一化(BatchNorm)
定义:对一个批次内的特征进行归一化(调整均值为 0、方差为 1),常用在卷积层之后。
作用:
加速模型训练(缓解梯度消失);降低对初始化的敏感性;一定程度上抑制过拟合。
- 特征图
定义:卷积操作输出的多维张量(形状为[batch_size, 通道数, 高度, 宽度]),是对输入图像的 "抽象特征表示"。
特点:
浅层特征图:对应边缘、纹理等低级特征;
深层特征图:对应物体轮廓、类别等高级特征。
- 调度器(学习率调度器)
定义:训练过程中动态调整学习率的工具(直接修改基础学习率)。
作用:前期用较大学习率快速收敛,后期用较小学习率精细优化。
常用类型:
(1)StepLR:按固定步长衰减;
(2)ReduceLROnPlateau:根据验证集指标衰减。
作业:修改调度器与 CNN 结构,对比训练差异



