24/10/12算法笔记 VGG

VGG特点:

1.深度:非常深

2.卷积核采用3*3,使得网络能够捕捉到更细粒度的图像特征

3.全连接层:使用全连接层来分类

4.使用ReLU激活函数,有助于缓解梯度消失

5.在卷积层和池化层后,使用局部归一化,有助于提高网络训练速度和性能

复制代码
def vgg_block(num_convs,in_channels,out_channels):
    layers = []
    for_ in range(num_convs):
        layers.append(nn.Conv2d(in_channels,out_channels,
                                kernel_size=3,padding=1))
        layers.append(nn.ReLU())
        in_channels = out_channels
    layers.append(nn.MaxPool2d(kernel_size=2,stride=2))
    return nn.Sequential(*layers)

问题:

关于代码里面的num_convs怎么选择vgg块的配置

根据任务的复杂性:

  • 更复杂的任务(例如,具有大量类别的图像分类)可能需要更深的网络来捕获更抽象的特征,因此可能选择VGG16或VGG19。

数据集大小:大的选大的,小的选小的(比如vgg11或13)

训练资源,训练时间,泛化能力,网络越深,参数越多,会提高泛化能力,也增加了过拟合风险

相关推荐
海森大数据1 分钟前
微软发布AI Agent五大可观测性实践,专治智能体“盲跑”难题
人工智能·microsoft
Christo37 分钟前
TFS-2003《A Contribution to Convergence Theory of Fuzzy c-Means and Derivatives》
人工智能·算法·机器学习
QT 小鲜肉8 分钟前
【QT随笔】结合应用案例一文完美概括QT中的队列(Queue)
c++·笔记·qt·学习方法·ai编程
qq_508823409 分钟前
金融量化指标--4Sharpe夏普比率
人工智能
TMT星球22 分钟前
中国AI云市场报告:阿里云份额达35.8%,高于2至4名总和
人工智能·阿里云·云计算
Yingjun Mo28 分钟前
1. 统计推断-ALMOND收敛性分析
人工智能·算法·机器学习
A尘埃42 分钟前
TensorFlow 和 PyTorch两大深度学习框架训练数据,并协作一个电商推荐系统
pytorch·深度学习·tensorflow
optimistic_chen1 小时前
【Java EE进阶 --- SpringBoot】Spring DI详解
spring boot·笔记·后端·spring·java-ee·mvc·di
小关会打代码1 小时前
计算机视觉之多模板匹配
人工智能·计算机视觉
AI 嗯啦1 小时前
计算机视觉----opencv----身份证号码识别案例
人工智能·opencv·计算机视觉