24/10/12算法笔记 VGG

VGG特点:

1.深度:非常深

2.卷积核采用3*3,使得网络能够捕捉到更细粒度的图像特征

3.全连接层:使用全连接层来分类

4.使用ReLU激活函数,有助于缓解梯度消失

5.在卷积层和池化层后,使用局部归一化,有助于提高网络训练速度和性能

复制代码
def vgg_block(num_convs,in_channels,out_channels):
    layers = []
    for_ in range(num_convs):
        layers.append(nn.Conv2d(in_channels,out_channels,
                                kernel_size=3,padding=1))
        layers.append(nn.ReLU())
        in_channels = out_channels
    layers.append(nn.MaxPool2d(kernel_size=2,stride=2))
    return nn.Sequential(*layers)

问题:

关于代码里面的num_convs怎么选择vgg块的配置

根据任务的复杂性:

  • 更复杂的任务(例如,具有大量类别的图像分类)可能需要更深的网络来捕获更抽象的特征,因此可能选择VGG16或VGG19。

数据集大小:大的选大的,小的选小的(比如vgg11或13)

训练资源,训练时间,泛化能力,网络越深,参数越多,会提高泛化能力,也增加了过拟合风险

相关推荐
xhyu612 分钟前
【学习笔记】推荐系统 (3.召回:矩阵补充、线上服务、双塔模型)
笔记·学习·矩阵
wb1892 分钟前
LVS各种调度以及Haproxy调度重习
笔记·云计算·lvs·haproxy
无忧智库5 分钟前
大型国际机场全域态势感知与航班运行协同决策系统 (A-CDM) 深度解析:打造智慧民航的“最强大脑”(WORD)
人工智能
lisw056 分钟前
如何在科学出版中负责任地使用人工智能?
人工智能·机器学习
fanged7 分钟前
IT数学基础番外1--手算梯度下降(TODO)
笔记
mtouch3338 分钟前
三维数字沙盘智能交互式可视化动态主界面系统
人工智能·ai·信息可视化·无人机·虚拟现实·电子沙盘·数字沙盘
AC赳赳老秦11 分钟前
多模态 AI 驱动办公智能化变革:DeepSeek 赋能图文转写与视频摘要的高效实践
java·ide·人工智能·python·prometheus·ai-native·deepseek
日更嵌入式的打工仔12 分钟前
C/S 与 B/S 架构
笔记
未来之窗软件服务12 分钟前
AI人工智能(十二)C# 运行sensevoice onnx—东方仙盟练气期
开发语言·人工智能·c#·仙盟创梦ide·东方仙盟
蒸蒸yyyyzwd16 分钟前
数据库学习笔记
数据库·笔记