1. 彩色 / 灰度图的训练测试规范:"封装在函数里"
简单说就是把 "训练模型" 和 "测试模型" 的代码,分别写成两个独立的函数(比如叫train()和test())。
- 好处:代码更整洁,想训练就调用
train(),想测试就调用test(),后续复用也方便。
2. 展平操作:"除 batchsize 外全部展平"
比如你有一张彩色图,形状是[batchsize, 高, 宽, 通道数](比如[32, 28, 28, 3],代表 32 张 28×28 的 3 通道彩色图)。"展平" 就是把高、宽、通道数这几个维度合并成一个维度,变成[32, 28×28×3](也就是[32, 2352])。
- 目的:把图片的 "二维像素 + 通道" 变成 "一维向量",方便后续模型计算。
3. dropout 操作:"训练丢、测试关"
dropout 是防止模型 "学太死" 的技巧:
- 训练阶段:随机让一部分神经元 "罢工"(不参与计算),避免模型过度依赖某些神经元。
- 测试阶段 :要切换到
eval模式,把 dropout 关掉(所有神经元都工作),这样才能得到稳定的测试结果。