简明 | Yolo-v3结构理解摘要

目录

整体结构

DBL

Res-n

Res-unit

concat

上采样


整体结构

网络主要包括两部分,一个部分是主干网络Darknet-53,一个部分使用特征金字塔(FPN)融合、加强特征提取并利用卷积进行预测。

DBL

DBL,即Darknetconv2d_BN_Leaky,就是conv+BN(Batch Normalization)+Leaky relu,三者共同构成组件。除最后一层卷积层外,BN和leaky relu与卷积层完整绑定。

Res-n

Res-n,即残差模块,n表示这个Res-block里含有多少个Res-unit。yolo-v3首次借鉴ResNet的残差结构,让网络更深,例如从v2的darknet-19到v3的darknet-53。http://t.csdnimg.cn/swIL4

Res-unit

Res-u,即残差单元,含有多个DBL,残差模块中含有一个或多个残差单元。

concat

concat,即拼接层,PyTorch中就是张量拼接,将Darknet中间层和后面的某一层的上采样进行拼接。拼接的操作和残差层add的操作是不一样的,拼接会扩充张量的维度,而add只是直接相加不会导致张量维度的改变。

上采样

上采样层,放大图片和增加图片的分辨率,将提取到的Feature Map进行放大, 从而以更高的分辨率进行显示图像。这里的图像放大,不是下采样的逆操作,通常通过双线性插值或转置卷积实现。

相关推荐
pythonpioneer8 分钟前
PyTorch3D:基于 PyTorch 的高效 3D 深度学习工具库
pytorch·深度学习·其他·3d
顾北顾31 分钟前
多头注意力机制
人工智能·深度学习·算法
大江东去浪淘尽千古风流人物1 小时前
【PromptStereo】零样本立体匹配新范式:用结构与运动Prompt驱动迭代优化(CVPR 2026)
深度学习·3d·slam·视觉定位·dust3r·3d重建·mast3r
Rocky Ding*2 小时前
Latent Consistency Models:一篇读懂扩散模型的少步生成核心基础知识
人工智能·深度学习·机器学习·ai作画·stable diffusion·aigc·ai-native
戴西软件3 小时前
戴西 DLM 许可授权管理系统:破解无网络环境下工业软件授权难题,助力制造企业降本增效
网络·人工智能·python·深度学习·程序人生·算法·制造
Black蜡笔小新3 小时前
制造业AI质检工作站/企业AI算力工作站DLTM助力制造业质检智能化升级
人工智能·深度学习·机器学习
西西弗Sisyphus5 小时前
YOLO26 自定义损失函数 分类任务自定义损失的接口约定
yolo·yolo26
渡之5 小时前
GRiM-Net 深度解析 | 无人机 GNSS 拒止场景下两阶段跨视角视觉定位框架
深度学习·算法·动态规划·无人机
埃科光电5 小时前
应用分享丨告别测量盲区!锂电极片刻槽检测新方案
图像处理·计算机视觉·视觉检测·相机