经典网络模型

Alexnet


VGG


VGG的启示

VGGNet采用了多次堆叠3x3的卷积核,这样做的目的是减少参数的数量。

例如,2个3x3的卷积核效果相当于1个5x5的卷积核效果,因为它们的感受野(输入图像上映射区域的大小)相同。但2个3x3卷积核的参数个数(18个)却比1个5x5(25个)的卷积核参数个数少。

类似地,3个3x3的卷积核相当于1个7x7的卷积核,而1个7x7的卷积核的参数个数为49,而3个3x3的卷积核的参数个数仅为27。

感受野


ResNet

为了解决深度神经网络存在的问题

· 层数越多,训练效果一定越好吗?

· 如何优化过深的神经网络?

· 如何避免梯度消失和梯度爆炸?

ResNet 即深度残差网络

ResNet使用了一种连接方式叫做"shortcut connection",顾名思义,shortcut就是"抄近道"的意思

ResNet模型引入残差网络结构,在两层或两层以上的节点两端添加了一条"捷径",这样一来,原来的输出F(x)就变成了F(x)+x

ResNet通过引入残差结构,我们就可以直接使用传统的反向传播对很深的神经网络进行训练,并且收敛速度快,误差小网络越深,梯度消失的现象就越来越明显,网络的训练效果也不好,这样的问题就称为"退化"

ResNet通过引入残差结构,很好地解决了"退化"问题,退化与过拟合都会使网络预测准确率降低,但两者并不是一回事

相关推荐
zadyd几秒前
一个基本的意图识别该包含哪些内容
人工智能·机器学习
南宫乘风2 分钟前
LLaMA-Factory 给 Qwen1.5 做 LoRA 微调 实战
人工智能·深度学习·llama
CoderJia程序员甲6 分钟前
GitHub 热榜项目 - 日榜(2026-03-20)
人工智能·ai·大模型·github·ai教程
芯跳加速9 分钟前
AI 视频自动化学习日记 · 第三天
人工智能·学习·ai·自动化·音视频
AI英德西牛仔12 分钟前
豆包公式格式
人工智能·ai·deepseek·ds随心转
benben04414 分钟前
Triton编程技术背诵核心概念
人工智能
前端摸鱼匠14 分钟前
面试题4:多头注意力(MHA)相比单头注意力的优势是什么?Head数如何影响模型?
人工智能·ai·面试·职场和发展·求职招聘
yhdata20 分钟前
车载图像处理芯片发展按下“快进键”:至2032年市场规模将逼近27.29亿元,产业动能强劲
图像处理·人工智能
NOCSAH21 分钟前
统好AI数智平台CRM:智能驱动客户管理新体验
人工智能·数智化一体平台·统好ai
视***间26 分钟前
2026:AI算力元年的加冕与思辨
人工智能·microsoft·机器人·边缘计算·智能硬件·视程空间