CNN神经网络调参技巧

一、基本网络结构

1.若干块,每块:卷积+BN+激活+池化

2.若干块,每块:卷积+激活+Dropout

3.若干块,每块:fc+激活+Dropout

二、技巧

  1. 损失曲线
  • 常见曲线是先快速下降后趋于平缓,如果线性下降,说明学习率可能过低
  • 曲线震荡剧烈不平滑,可能是由于batchsize过小导致
  • 训练损失正常下降,验证损失先下降后上升,说明过拟合,可以调整dropout等解决
  • 损失最低点不代表模型性能最佳点

2.调参

  • 优先使用大的网络结构训练出过拟合效果
  • 第一层卷积核通道数应当较大,因为浅层特征较为重要
  • 主要还是根据损失函数进行调整
  • batchsize大容易过拟合,先用大batchsize,再用dropout解决过拟合

3.其他

  • 使用same卷积,更方便,不用每次计算卷积后的输出尺寸
相关推荐
油泼辣子多加18 分钟前
【信创】算法开发适配
人工智能·深度学习·算法·机器学习
数据皮皮侠23 分钟前
2m气温数据集(1940-2024)
大数据·数据库·人工智能·制造·微信开放平台
lzhdim33 分钟前
魅族手机介绍
人工智能·智能手机
Debroon35 分钟前
现代医疗中的AI智能体
人工智能
Winner130036 分钟前
查看rk3566摄像头设备、能力、支持格式
linux·网络·人工智能
shizhenshide1 小时前
“绕过”与“破解”的成本账:自行研发、购买API与外包打码的性价比全分析
人工智能·验证码·recaptcha·ezcaptcha·recaptcha v2
龙腾亚太1 小时前
大模型在工业物流领域有哪些应用
人工智能·具身智能·智能体·世界模型·智能体培训·具身智能培训
Deepoch1 小时前
智能清洁新纪元:Deepoc开发板如何重塑扫地机器人的“大脑“
人工智能·机器人·清洁机器人·具身模型·deepoc
装不满的克莱因瓶1 小时前
【Coze智能体实战二】一键生成儿歌背单词视频
人工智能·ai·实战·agent·工作流·智能体·coze
杰米不放弃1 小时前
AI大模型应用开发学习-26【20251227】
人工智能·学习