24/10/12算法笔记 VGG

VGG特点:

1.深度:非常深

2.卷积核采用3*3,使得网络能够捕捉到更细粒度的图像特征

3.全连接层:使用全连接层来分类

4.使用ReLU激活函数,有助于缓解梯度消失

5.在卷积层和池化层后,使用局部归一化,有助于提高网络训练速度和性能

复制代码
def vgg_block(num_convs,in_channels,out_channels):
    layers = []
    for_ in range(num_convs):
        layers.append(nn.Conv2d(in_channels,out_channels,
                                kernel_size=3,padding=1))
        layers.append(nn.ReLU())
        in_channels = out_channels
    layers.append(nn.MaxPool2d(kernel_size=2,stride=2))
    return nn.Sequential(*layers)

问题:

关于代码里面的num_convs怎么选择vgg块的配置

根据任务的复杂性:

  • 更复杂的任务(例如,具有大量类别的图像分类)可能需要更深的网络来捕获更抽象的特征,因此可能选择VGG16或VGG19。

数据集大小:大的选大的,小的选小的(比如vgg11或13)

训练资源,训练时间,泛化能力,网络越深,参数越多,会提高泛化能力,也增加了过拟合风险

相关推荐
九.九4 小时前
ops-transformer:AI 处理器上的高性能 Transformer 算子库
人工智能·深度学习·transformer
春日见4 小时前
拉取与合并:如何让个人分支既包含你昨天的修改,也包含 develop 最新更新
大数据·人工智能·深度学习·elasticsearch·搜索引擎
恋猫de小郭4 小时前
AI 在提高你工作效率的同时,也一直在增加你的疲惫和焦虑
前端·人工智能·ai编程
时代的凡人4 小时前
0208晨间笔记
笔记
deephub4 小时前
Agent Lightning:微软开源的框架无关 Agent 训练方案,LangChain/AutoGen 都能用
人工智能·microsoft·langchain·大语言模型·agent·强化学习
偷吃的耗子4 小时前
【CNN算法理解】:三、AlexNet 训练模块(附代码)
深度学习·算法·cnn
大模型RAG和Agent技术实践4 小时前
从零构建本地AI合同审查系统:架构设计与流式交互实战(完整源代码)
人工智能·交互·智能合同审核
今天只学一颗糖4 小时前
1、《深入理解计算机系统》--计算机系统介绍
linux·笔记·学习·系统架构
老邋遢4 小时前
第三章-AI知识扫盲看这一篇就够了
人工智能
互联网江湖4 小时前
Seedance2.0炸场:长短视频们“修坝”十年,不如AI放水一天?
人工智能