经典网络模型

Alexnet


VGG


VGG的启示

VGGNet采用了多次堆叠3x3的卷积核,这样做的目的是减少参数的数量。

例如,2个3x3的卷积核效果相当于1个5x5的卷积核效果,因为它们的感受野(输入图像上映射区域的大小)相同。但2个3x3卷积核的参数个数(18个)却比1个5x5(25个)的卷积核参数个数少。

类似地,3个3x3的卷积核相当于1个7x7的卷积核,而1个7x7的卷积核的参数个数为49,而3个3x3的卷积核的参数个数仅为27。

感受野


ResNet

为了解决深度神经网络存在的问题

· 层数越多,训练效果一定越好吗?

· 如何优化过深的神经网络?

· 如何避免梯度消失和梯度爆炸?

ResNet 即深度残差网络

ResNet使用了一种连接方式叫做"shortcut connection",顾名思义,shortcut就是"抄近道"的意思

ResNet模型引入残差网络结构,在两层或两层以上的节点两端添加了一条"捷径",这样一来,原来的输出F(x)就变成了F(x)+x

ResNet通过引入残差结构,我们就可以直接使用传统的反向传播对很深的神经网络进行训练,并且收敛速度快,误差小网络越深,梯度消失的现象就越来越明显,网络的训练效果也不好,这样的问题就称为"退化"

ResNet通过引入残差结构,很好地解决了"退化"问题,退化与过拟合都会使网络预测准确率降低,但两者并不是一回事

相关推荐
Coovally AI模型快速验证几秒前
突破闭集限制:3D-MOOD 实现开集单目 3D 检测新 SOTA
人工智能·yolo·计算机视觉·3d·目标跟踪·无人机
亚马逊云开发者4 分钟前
基于 CoT 协调多 MCP Tool — 智能运维 Redshift
人工智能
ai绘画-安安妮7 分钟前
AI工程师必看!GitHub上10个高价值LLM开源项目,建议立即收藏
人工智能·学习·程序员·开源·大模型·github·转行
小言从不摸鱼9 分钟前
Grok-4 :AI 基准测试霸主,速度与智能并存——但代价几何?
人工智能·gpt·深度学习·语言模型·自然语言处理
DG_DH16820 分钟前
企业级AI应用,Dify集成RAGFlow知识库保姆教程
人工智能·知识库·dify·ragflow
大翻哥哥27 分钟前
Python 2025:AI代理、Rust与异步编程的新时代
开发语言·人工智能·python
我是海飞28 分钟前
TensorFlow的Yes/No 关键词识别模型训练
人工智能·python·tensorflow·语音识别·neo4j
哔哩哔哩技术33 分钟前
AniSoraV3 正式开源,长视频创作智能体框架AniME技术揭秘
人工智能
云卓SKYDROID35 分钟前
无人机GPS悬停模块技术解析
人工智能·目标跟踪·无人机·高科技·航线系统
百锦再35 分钟前
Python:AI开发第一语言的全面剖析
java·开发语言·人工智能·python·sql·ai·radis