CNN神经网络调参技巧

一、基本网络结构

1.若干块,每块:卷积+BN+激活+池化

2.若干块,每块:卷积+激活+Dropout

3.若干块,每块:fc+激活+Dropout

二、技巧

  1. 损失曲线
  • 常见曲线是先快速下降后趋于平缓,如果线性下降,说明学习率可能过低
  • 曲线震荡剧烈不平滑,可能是由于batchsize过小导致
  • 训练损失正常下降,验证损失先下降后上升,说明过拟合,可以调整dropout等解决
  • 损失最低点不代表模型性能最佳点

2.调参

  • 优先使用大的网络结构训练出过拟合效果
  • 第一层卷积核通道数应当较大,因为浅层特征较为重要
  • 主要还是根据损失函数进行调整
  • batchsize大容易过拟合,先用大batchsize,再用dropout解决过拟合

3.其他

  • 使用same卷积,更方便,不用每次计算卷积后的输出尺寸
相关推荐
skywalk816314 小时前
windows下安装使用comfy
人工智能
天云数据14 小时前
年末回顾:从鹦鹉到乌鸦,天云数据2025智能进化与产业深耕
人工智能
肾透侧视攻城狮14 小时前
《解锁TensorFlow NLP实战:一站式掌握文本预处理、向量化技术与情感分析管道最佳实践》
人工智能·深度学习·文本预处理·向量化文本·向量化模式选项·bert分词器·tf构建文本处理管道
Zzz 小生14 小时前
LangChain Short-term memory:短期记忆使用完全指南
人工智能·python·langchain·github
hqyjzsb15 小时前
非技术管理层推动企业AI转型的系统化实施策略
人工智能·跳槽·创业创新·学习方法·业界资讯·远程工作·程序员创富
智慧地球(AI·Earth)15 小时前
在Windows上使用Claude Code并集成到PyCharm IDE的完整指南
ide·人工智能·windows·python·pycharm·claude code
莫生灬灬15 小时前
Cloak 指纹浏览器 2.0 - 全网首个支持 AI 和 Skill 的指纹浏览器
人工智能
琅琊榜首202015 小时前
AI辅助小说转短剧:全流程实操与技术落地指南
人工智能
Katecat9966315 小时前
【深度学习】Faster-RCNN改进:钩子状态识别与分类三种状态自动检测
人工智能·深度学习·分类
niuniudengdeng15 小时前
一种基于HFF4材料的自消亡类脑芯片架构构想:把神经网络的训练变成物理化学过程
人工智能·神经网络·算法