简明 | Yolo-v3结构理解摘要

目录

整体结构

DBL

Res-n

Res-unit

concat

上采样


整体结构

网络主要包括两部分,一个部分是主干网络Darknet-53,一个部分使用特征金字塔(FPN)融合、加强特征提取并利用卷积进行预测。

DBL

DBL,即Darknetconv2d_BN_Leaky,就是conv+BN(Batch Normalization)+Leaky relu,三者共同构成组件。除最后一层卷积层外,BN和leaky relu与卷积层完整绑定。

Res-n

Res-n,即残差模块,n表示这个Res-block里含有多少个Res-unit。yolo-v3首次借鉴ResNet的残差结构,让网络更深,例如从v2的darknet-19到v3的darknet-53。http://t.csdnimg.cn/swIL4

Res-unit

Res-u,即残差单元,含有多个DBL,残差模块中含有一个或多个残差单元。

concat

concat,即拼接层,PyTorch中就是张量拼接,将Darknet中间层和后面的某一层的上采样进行拼接。拼接的操作和残差层add的操作是不一样的,拼接会扩充张量的维度,而add只是直接相加不会导致张量维度的改变。

上采样

上采样层,放大图片和增加图片的分辨率,将提取到的Feature Map进行放大, 从而以更高的分辨率进行显示图像。这里的图像放大,不是下采样的逆操作,通常通过双线性插值或转置卷积实现。

相关推荐
L、21812 小时前
CANN调优工具链全景:从profiler到tensorboard的完整观测体系
linux·运维·服务器·深度学习
25Qi导航13 小时前
找刊网使用指南:从选刊到发表的功能说明
人工智能·深度学习·期刊·找刊网.com·找刊网
AI技术控13 小时前
KV Cache 缓存机制的原理和应用:从 Transformer 推理到大模型服务优化
人工智能·python·深度学习·缓存·自然语言处理·transformer
Runawayliquor13 小时前
hcomm:昇腾集群通信的底层原语
深度学习·性能优化·交互
gihigo199813 小时前
基于粒子滤波的三维雷达目标跟踪方案
人工智能·计算机视觉·目标跟踪
J&A~ing13 小时前
第一章 opencv 的 Windows源码在 Visual Studio 下的编译安装
人工智能·windows·opencv·计算机视觉·visual studio
爱睡懒觉的焦糖玛奇朵14 小时前
【从视频到数据集:焦糖玛奇朵的魔法工具Video To YOLO Dataset】
人工智能·python·学习·yolo·音视频
MhZhou041214 小时前
1.11M参数小模型实现脑瘤分割 CVPR 2026 Findings 开源
算法·计算机视觉·3d·空间计算
有为少年14 小时前
Welford算法 | 从单一到批次
大数据·人工智能·深度学习·神经网络·算法·机器学习
钓了猫的鱼儿15 小时前
基于深度学习+AI的水下目标目标检测与预警系统(Python源码+数据集+UI可视化
人工智能·深度学习·智能手机