24/10/12算法笔记 VGG

VGG特点:

1.深度:非常深

2.卷积核采用3*3,使得网络能够捕捉到更细粒度的图像特征

3.全连接层:使用全连接层来分类

4.使用ReLU激活函数,有助于缓解梯度消失

5.在卷积层和池化层后,使用局部归一化,有助于提高网络训练速度和性能

复制代码
def vgg_block(num_convs,in_channels,out_channels):
    layers = []
    for_ in range(num_convs):
        layers.append(nn.Conv2d(in_channels,out_channels,
                                kernel_size=3,padding=1))
        layers.append(nn.ReLU())
        in_channels = out_channels
    layers.append(nn.MaxPool2d(kernel_size=2,stride=2))
    return nn.Sequential(*layers)

问题:

关于代码里面的num_convs怎么选择vgg块的配置

根据任务的复杂性:

  • 更复杂的任务(例如,具有大量类别的图像分类)可能需要更深的网络来捕获更抽象的特征,因此可能选择VGG16或VGG19。

数据集大小:大的选大的,小的选小的(比如vgg11或13)

训练资源,训练时间,泛化能力,网络越深,参数越多,会提高泛化能力,也增加了过拟合风险

相关推荐
国科安芯几秒前
微小卫星红外相机双MCU冗余架构的抗辐照可靠性评估
人工智能·单片机·嵌入式硬件·数码相机·架构·自动化·安全性测试
JOBkiller1232 分钟前
基于YOLO11的排水管道缺陷检测与分类系统_2
人工智能·机器学习·分类
程序员:钧念3 分钟前
机器学习与深度学习的区别
人工智能·python·gpt·深度学习·机器学习
糖葫芦君4 分钟前
TRPO-trust region policy optimization论文讲解
人工智能·算法·机器学习·强化学习
人工小情绪7 分钟前
PSPNet (Pyramid Scene Parsing Network)论文解读
人工智能·深度学习·计算机视觉
码上掘金10 分钟前
基于YOLO和大语言模型的交通标识智能识别系统
人工智能·yolo·语言模型
LaughingZhu14 分钟前
Product Hunt 每日热榜 | 2026-01-18
大数据·人工智能·经验分享·搜索引擎·产品运营
向上的车轮15 分钟前
AI编辑器要解决哪些关键问题?
人工智能·编辑器
Lonely 净土15 分钟前
渗透学习笔记-前四天
笔记·学习