24/10/12算法笔记 VGG

VGG特点:

1.深度:非常深

2.卷积核采用3*3,使得网络能够捕捉到更细粒度的图像特征

3.全连接层:使用全连接层来分类

4.使用ReLU激活函数,有助于缓解梯度消失

5.在卷积层和池化层后,使用局部归一化,有助于提高网络训练速度和性能

复制代码
def vgg_block(num_convs,in_channels,out_channels):
    layers = []
    for_ in range(num_convs):
        layers.append(nn.Conv2d(in_channels,out_channels,
                                kernel_size=3,padding=1))
        layers.append(nn.ReLU())
        in_channels = out_channels
    layers.append(nn.MaxPool2d(kernel_size=2,stride=2))
    return nn.Sequential(*layers)

问题:

关于代码里面的num_convs怎么选择vgg块的配置

根据任务的复杂性:

  • 更复杂的任务(例如,具有大量类别的图像分类)可能需要更深的网络来捕获更抽象的特征,因此可能选择VGG16或VGG19。

数据集大小:大的选大的,小的选小的(比如vgg11或13)

训练资源,训练时间,泛化能力,网络越深,参数越多,会提高泛化能力,也增加了过拟合风险

相关推荐
IT_陈寒21 分钟前
SpringBoot自动配置坑了我一晚上,原来问题出在这
前端·人工智能·后端
吴佳浩1 小时前
Hermes Agent 连环 400 真凶找到了:一个 call_id 让人炸毛
人工智能·llm·agent
程序员cxuan2 小时前
幽默,一个 Github 名字叫“马尾辫”,但是他给你省了 80% 的 token
人工智能·后端·程序员
宋哥转AI2 小时前
Agent记忆模块系列:03存储与检索链路实测验证
人工智能·agent
老金带你玩AI2 小时前
老金开源GoalPro,别让AI把目标越写越烂
人工智能
Bigfish_coding3 小时前
前端转agent-【python】-08 用 LangGraph 把 Agent 做成状态机:像写 Vue 3 状态管理一样编排 AI 流程
人工智能
刺猬的温驯3 小时前
语音克隆模型的难点之一:音素对齐及交叉注意力早期失效问题 (兼论旋转位置编码)——F5-TTS、SupertonicTTS、VoxFlash-TTS 对比
人工智能·语音合成·tts
道友可好4 小时前
AI 是最好的混乱放大器:代码熵管理实战
前端·人工智能·后端
不加辣椒5 小时前
第7章 边界与约束技术:确保输出的准确性与安全性
人工智能
AI悦创Python辅导5 小时前
Claude Code 越用越乱?Sub-Agents 才是上下文污染的解法
人工智能