CNN神经网络调参技巧

赏你个麻辣烫儿2024-07-01 13:04

一、基本网络结构

1.若干块，每块：卷积+BN+激活+池化

2.若干块，每块：卷积+激活+Dropout

3.若干块，每块：fc+激活+Dropout

二、技巧

损失曲线

常见曲线是先快速下降后趋于平缓，如果线性下降，说明学习率可能过低
曲线震荡剧烈不平滑，可能是由于batchsize过小导致
训练损失正常下降，验证损失先下降后上升，说明过拟合，可以调整dropout等解决
损失最低点不代表模型性能最佳点

2.调参

优先使用大的网络结构训练出过拟合效果
第一层卷积核通道数应当较大，因为浅层特征较为重要
主要还是根据损失函数进行调整
batchsize大容易过拟合，先用大batchsize，再用dropout解决过拟合

3.其他

使用same卷积，更方便，不用每次计算卷积后的输出尺寸

上一篇：吴恩达2022机器学习专项课程C2W3：2.27 选修_数据倾斜

下一篇：探索Java中的事件驱动架构（EDA）

热门推荐

01UV安装并设置国内源 02Qwen3-Coder 快速上手教程 | Qwen Code + Claude Code 03【2025.08.06最新版】Android Studio下载、安装及配置记录（自动下载sdk）04KGG转MP3工具|非KGM文件|解密音频 05TRAE 规则（Rules）配置指南：个人习惯、团队规范与最佳实践 062025最新国内服务器可用docker源仓库地址大全（2025年8月更新）07NVIDIA显卡驱动、CUDA、cuDNN 和 TensorRT 版本匹配指南 08蜘蛛磁力搜索引擎大全，如何使用蜘蛛磁力查找磁力链接 09TRAE Rules 实践：为项目配置 6A 工作流 10阿里开源首个图像生成基础模型——Qwen-Image本地部署教程，超强中文渲染能力刷新SOTA！