CNN神经网络调参技巧

一、基本网络结构

1.若干块,每块:卷积+BN+激活+池化

2.若干块,每块:卷积+激活+Dropout

3.若干块,每块:fc+激活+Dropout

二、技巧

  1. 损失曲线
  • 常见曲线是先快速下降后趋于平缓,如果线性下降,说明学习率可能过低
  • 曲线震荡剧烈不平滑,可能是由于batchsize过小导致
  • 训练损失正常下降,验证损失先下降后上升,说明过拟合,可以调整dropout等解决
  • 损失最低点不代表模型性能最佳点

2.调参

  • 优先使用大的网络结构训练出过拟合效果
  • 第一层卷积核通道数应当较大,因为浅层特征较为重要
  • 主要还是根据损失函数进行调整
  • batchsize大容易过拟合,先用大batchsize,再用dropout解决过拟合

3.其他

  • 使用same卷积,更方便,不用每次计算卷积后的输出尺寸
相关推荐
爱吃羊的老虎5 分钟前
【大模型应用】MCP (Model Context Protocol):AI界的USB接口
人工智能
用户51914958484511 分钟前
curl中的TFTP实现:整数下溢导致堆内存越界读取漏洞
人工智能·aigc
老赵全栈实战13 分钟前
《从零搭建RAG系统第5天:安装Ollama》
人工智能
星爷AG I19 分钟前
12-4 表情识别(AGI基础理论)
人工智能·agi
Sopaco20 分钟前
AI驱动的多智能体协作模式:Actor-Critic在软件开发中的应用
人工智能
heimeiyingwang27 分钟前
AI 在企业客服场景的应用:智能问答与工单自动化
人工智能
小程故事多_8032 分钟前
OpenViking,重新定义AI Agents上下文管理的开源利器
人工智能·aigc
菜鸟小芯32 分钟前
DAY4 基于 OpenClaw + 飞书开放平台实现 AI 新闻推送机器人
人工智能·机器人·飞书
systeminof36 分钟前
七色年味映双流:AI镜头下的烟火中国年
人工智能
yuezhilangniao38 分钟前
【AI 编辑器开发规范 v2.1 版】—— 为 AI 时代的敏捷开发而生
人工智能·编辑器·敏捷流程