每天五分钟计算机视觉:VGG网络相对于AlexNet网络有哪些不同?

本文重点

在前面的课程中,我们已经学习了VGG网络模型,也学习了AlexNet网络模型,AlexNet模型先于VGG网络模型产生,所以VGG在一定程度上要优于AlexNet模型,二者来看一下,二者究竟有什么不同?

深度

AlexNet是一个8层的卷积神经网络,而VGG16是它的两倍,众所周知,神经网络的深度越大,往往学习能力越强,所以VGG的性能相对于AlexNet有了一个明显的提升。

卷积核

VGG相对于AlexNet模型,VGG只使用了3*3的卷积核,这带来了参数量的极大减少,我们来比较一下。

AlexNet的第一个卷积层输出维度96维,而卷积核大小为11*11,那么参数量为96*3*11

VGG的参数量为64*3*3*3

96*3*11/(64*3*3*3)=20

也就是说二者相差20倍,那么计算量就相差了20倍,这就是的VGG虽然深度比AlexNet大,但是参数量却没有增加的很夸装,整个模型只有550M,而8层的AlexNet达到了240M。

池化

VGG中池化的核大小为2*2,然后步长为2。而AlexNet中采用了重叠池化方案,核大小为3*3,步长为2。这样不重叠的池化的计算量会少一些。但是重叠的池化能够有效的降低过拟合问题。

数据增强

VGG使用了更多的数据增强的方式,即Scale Jittering。先固定一种裁剪尺寸m*m,比如224*224,然后把图片的最短边缩放到一个大于m的值,长边也相应的变化,最后裁剪出一张m*m的图片。

这种方法比直接将图片缩放到224*224来说,存在更大的操作空间,当然有可能剪掉图片的重要区域,但是在大数据下,这种影响可以忽略不计。

相关推荐
Bamtone20252 分钟前
PCB切片分析新方案:Bamtone MS90集成AI的智能测量解决方案
人工智能
Warren2Lynch4 分钟前
2026年专业软件工程与企业架构的智能化演进
人工智能·架构·软件工程
_waylau13 分钟前
【HarmonyOS NEXT+AI】问答08:仓颉编程语言是中文编程语言吗?
人工智能·华为·harmonyos·鸿蒙·仓颉编程语言·鸿蒙生态·鸿蒙6
攻城狮7号25 分钟前
Kimi 发布并开源 K2.5 模型:开始在逻辑和干活上卷你了
人工智能·ai编程·视觉理解·kimi code·kimi k2.5·agent 集群
szxinmai主板定制专家28 分钟前
基于 PC 的控制技术+ethercat+linux实时系统,助力追踪标签规模化生产,支持国产化
arm开发·人工智能·嵌入式硬件·yolo·fpga开发
阿狸OKay42 分钟前
einops 库和 PyTorch 的 einsum 的语法
人工智能·pytorch·python
低调小一1 小时前
Google AI Agent 白皮书拆解(1):从《Introduction to Agents》看清 Agent 的工程底座
人工智能
feasibility.1 小时前
混元3D-dit-v2-mv-turbo生成3D模型初体验(ComfyUI)
人工智能·3d·aigc·三维建模·comfyui
极智-9961 小时前
GitHub 热榜项目-日榜精选(2026-02-02)| AI智能体、终端工具、视频生成等 | openclaw、99、Maestro等
人工智能·github·视频生成·终端工具·ai智能体·电子书管理·rust工具
悟纤1 小时前
AI 音乐创作中的音乐织体(Texture)完整指南 | Suno高级篇 | 第30篇
人工智能·suno·suno ai·suno api·ai music