每天五分钟计算机视觉:VGG网络相对于AlexNet网络有哪些不同?

本文重点

在前面的课程中,我们已经学习了VGG网络模型,也学习了AlexNet网络模型,AlexNet模型先于VGG网络模型产生,所以VGG在一定程度上要优于AlexNet模型,二者来看一下,二者究竟有什么不同?

深度

AlexNet是一个8层的卷积神经网络,而VGG16是它的两倍,众所周知,神经网络的深度越大,往往学习能力越强,所以VGG的性能相对于AlexNet有了一个明显的提升。

卷积核

VGG相对于AlexNet模型,VGG只使用了3*3的卷积核,这带来了参数量的极大减少,我们来比较一下。

AlexNet的第一个卷积层输出维度96维,而卷积核大小为11*11,那么参数量为96*3*11

VGG的参数量为64*3*3*3

96*3*11/(64*3*3*3)=20

也就是说二者相差20倍,那么计算量就相差了20倍,这就是的VGG虽然深度比AlexNet大,但是参数量却没有增加的很夸装,整个模型只有550M,而8层的AlexNet达到了240M。

池化

VGG中池化的核大小为2*2,然后步长为2。而AlexNet中采用了重叠池化方案,核大小为3*3,步长为2。这样不重叠的池化的计算量会少一些。但是重叠的池化能够有效的降低过拟合问题。

数据增强

VGG使用了更多的数据增强的方式,即Scale Jittering。先固定一种裁剪尺寸m*m,比如224*224,然后把图片的最短边缩放到一个大于m的值,长边也相应的变化,最后裁剪出一张m*m的图片。

这种方法比直接将图片缩放到224*224来说,存在更大的操作空间,当然有可能剪掉图片的重要区域,但是在大数据下,这种影响可以忽略不计。

相关推荐
厦门小杨4 分钟前
汽车内饰的面料究竟如何依靠AI验布机实现检测创新
大数据·人工智能·深度学习·汽车·制造·ai视觉验布机·纺织
devnullcoffee9 分钟前
2026年Amazon Listing优化完全指南:COSMO算法与Rufus AI技术解析
人工智能·python·算法·亚马逊运营·amazon listing·cosmo算法·rufus ai技术
2501_9413297215 分钟前
长豆荚目标检测:Faster R-CNN改进模型实战与优化
目标检测·r语言·cnn
python机器学习ML18 分钟前
机器学习——16种模型(基础+集成学习)+多角度SHAP高级可视化+Streamlit交互式应用+RFE特征选择+Optuna+完整项目
人工智能·python·机器学习·分类·数据挖掘·scikit-learn·集成学习
OLOLOadsd12323 分钟前
激光设备目标检测 - 基于YOLOv5-HGNetV2的高精度检测模型实现_1
人工智能·yolo·目标检测
喜欢吃豆29 分钟前
PostgreSQL 高维向量存储架构深度解析:架构限制、核心原理与行业解决方案
数据库·人工智能·postgresql·架构·2025博客之星
lisw0530 分钟前
计算神经科学:概念、历史、内容与发展战略!
人工智能·科技·数学建模
OpenCSG32 分钟前
CSGHub vs HuggingFace:企业 AI 选型关键抉择,数据主权与开源创新如何两全?
人工智能·开源
Ryan老房32 分钟前
视频标注新方法-从视频到帧的智能转换
人工智能·yolo·目标检测·ai·目标跟踪·视频
ViiTor_AI44 分钟前
AI 变声器在视频本地化中的应用:2026 年最佳工具与选型分析
人工智能