24/10/12算法笔记 VGG

VGG特点:

1.深度:非常深

2.卷积核采用3*3,使得网络能够捕捉到更细粒度的图像特征

3.全连接层:使用全连接层来分类

4.使用ReLU激活函数,有助于缓解梯度消失

5.在卷积层和池化层后,使用局部归一化,有助于提高网络训练速度和性能

复制代码
def vgg_block(num_convs,in_channels,out_channels):
    layers = []
    for_ in range(num_convs):
        layers.append(nn.Conv2d(in_channels,out_channels,
                                kernel_size=3,padding=1))
        layers.append(nn.ReLU())
        in_channels = out_channels
    layers.append(nn.MaxPool2d(kernel_size=2,stride=2))
    return nn.Sequential(*layers)

问题:

关于代码里面的num_convs怎么选择vgg块的配置

根据任务的复杂性:

  • 更复杂的任务(例如,具有大量类别的图像分类)可能需要更深的网络来捕获更抽象的特征,因此可能选择VGG16或VGG19。

数据集大小:大的选大的,小的选小的(比如vgg11或13)

训练资源,训练时间,泛化能力,网络越深,参数越多,会提高泛化能力,也增加了过拟合风险

相关推荐
MARS_AI_15 小时前
云蝠智能 VoiceAgent 2.0:全栈语音交互能力升级
人工智能·自然语言处理·交互·信息与通信·agi
top_designer15 小时前
Substance 3D Stager:电商“虚拟摄影”工作流
人工智能·3d·设计模式·prompt·技术美术·教育电商·游戏美术
雷神大青椒15 小时前
离别的十字路口: 是否还记得曾经追求的梦想
人工智能·程序人生·职场和发展·玩游戏
心无旁骛~16 小时前
Masquerade 总结笔记:解锁野外人类视频的机器人政策学习潜力
笔记·机器人
m0_6501082416 小时前
多模态大模型 VS. 图像视频生成模型浅析
人工智能·技术边界与协同·mllm与生成模型·技术浅谈
ai_xiaogui16 小时前
Mac苹果版Krita AI一键安装教程:AIStarter+ComfyUI零基础部署全流程(X86/ARM双架构)
arm开发·人工智能·macos·comfyui·一键部署·ai绘画教程·kritaai
lapiii35816 小时前
[智能体设计模式] 第11章:目标设定与监控模式
人工智能·设计模式
这张生成的图像能检测吗16 小时前
(论文速读)WFF-Net:用于表面缺陷检测的可训练权重特征融合卷积神经网络
人工智能·深度学习·神经网络·缺陷检测·图像分割
shayudiandian17 小时前
RNN与LSTM详解:AI是如何“记住”信息的?
人工智能·rnn·lstm
美人鱼战士爱学习17 小时前
2025 Large language models for intelligent RDF knowledge graph construction
人工智能·语言模型·知识图谱