简明 | Yolo-v3结构理解摘要

目录

整体结构

DBL

Res-n

Res-unit

concat

上采样


整体结构

网络主要包括两部分,一个部分是主干网络Darknet-53,一个部分使用特征金字塔(FPN)融合、加强特征提取并利用卷积进行预测。

DBL

DBL,即Darknetconv2d_BN_Leaky,就是conv+BN(Batch Normalization)+Leaky relu,三者共同构成组件。除最后一层卷积层外,BN和leaky relu与卷积层完整绑定。

Res-n

Res-n,即残差模块,n表示这个Res-block里含有多少个Res-unit。yolo-v3首次借鉴ResNet的残差结构,让网络更深,例如从v2的darknet-19到v3的darknet-53。http://t.csdnimg.cn/swIL4

Res-unit

Res-u,即残差单元,含有多个DBL,残差模块中含有一个或多个残差单元。

concat

concat,即拼接层,PyTorch中就是张量拼接,将Darknet中间层和后面的某一层的上采样进行拼接。拼接的操作和残差层add的操作是不一样的,拼接会扩充张量的维度,而add只是直接相加不会导致张量维度的改变。

上采样

上采样层,放大图片和增加图片的分辨率,将提取到的Feature Map进行放大, 从而以更高的分辨率进行显示图像。这里的图像放大,不是下采样的逆操作,通常通过双线性插值或转置卷积实现。

相关推荐
TMT星球3 小时前
从像素复刻到行动控制:具身世界模型的底层逻辑探索
人工智能·深度学习·机器学习
试剂界的爱马仕4 小时前
Anti-mouse PD-1 mAb (Clone RMP1-14) 与 Axitinib 小鼠实验使用方案整理汇总
大数据·人工智能·深度学习·学习
AI 大模型学习不踩坑5 小时前
OpenClaw 完整教程:从安装到使用(官方脚本版)
java·人工智能·神经网络·机器学习·计算机视觉·自然语言处理·openclaw
于初见月5 小时前
3DGS相关方法中不同版本的光栅化模块报错
计算机视觉
MartinYeung57 小时前
[论文学习] CAMIA:下文感知成员推理攻击
人工智能·深度学习·学习
直接冲冲冲7 小时前
59-VGG
深度学习·神经网络·cnn
2601_962851747 小时前
计算机毕业设计之基于大数据的企业财务数据分析系统
大数据·人工智能·深度学习·信息可视化·课程设计
阿洛学长8 小时前
Cursor下载安装使用教程(最新详细图文)
人工智能·gpt·深度学习·ai·ai编程
renhongxia18 小时前
原生多模态对应用架构的重塑
人工智能·深度学习·机器学习·自然语言处理·架构·机器人
Nomarsgo8 小时前
工控机蓝屏怎么办?
人工智能·科技·计算机视觉·视觉检测·电脑