简明 | Yolo-v3结构理解摘要

目录

整体结构

DBL

Res-n

Res-unit

concat

上采样


整体结构

网络主要包括两部分,一个部分是主干网络Darknet-53,一个部分使用特征金字塔(FPN)融合、加强特征提取并利用卷积进行预测。

DBL

DBL,即Darknetconv2d_BN_Leaky,就是conv+BN(Batch Normalization)+Leaky relu,三者共同构成组件。除最后一层卷积层外,BN和leaky relu与卷积层完整绑定。

Res-n

Res-n,即残差模块,n表示这个Res-block里含有多少个Res-unit。yolo-v3首次借鉴ResNet的残差结构,让网络更深,例如从v2的darknet-19到v3的darknet-53。http://t.csdnimg.cn/swIL4

Res-unit

Res-u,即残差单元,含有多个DBL,残差模块中含有一个或多个残差单元。

concat

concat,即拼接层,PyTorch中就是张量拼接,将Darknet中间层和后面的某一层的上采样进行拼接。拼接的操作和残差层add的操作是不一样的,拼接会扩充张量的维度,而add只是直接相加不会导致张量维度的改变。

上采样

上采样层,放大图片和增加图片的分辨率,将提取到的Feature Map进行放大, 从而以更高的分辨率进行显示图像。这里的图像放大,不是下采样的逆操作,通常通过双线性插值或转置卷积实现。

相关推荐
逻辑君1 小时前
认知神经科学研究报告【20260010】
人工智能·深度学习·神经网络·机器学习
龙文浩_2 小时前
Attention Mechanism: From Theory to Code
人工智能·深度学习·神经网络·学习·自然语言处理
微臣愚钝2 小时前
prompt
人工智能·深度学习·prompt
宝贝儿好2 小时前
【LLM】第二章:文本表示:词袋模型、小案例:基于文本的推荐系统(酒店推荐)
人工智能·python·深度学习·神经网络·自然语言处理·机器人·语音识别
Dfreedom.3 小时前
计算机视觉全景图
人工智能·算法·计算机视觉·图像算法
啦啦啦在冲冲冲4 小时前
多头注意力机制的优势是啥,遇到长文本的情况,可以从哪些情况优化呢
人工智能·深度学习
xrgs_shz4 小时前
直方图法、最大类间方差法、迭代法和自适应阈值法的图像分割的基本原理和MATLAB实现
人工智能·计算机视觉·matlab
QQ676580085 小时前
服装计算机视觉数据集 连衣裙数据集 衣服类别识别 毛衣数据集 夹克衫AI识别 衬衫识别 裤子 数据集 yolo格式数据集
人工智能·yolo·计算机视觉·连衣裙·衣服类别·毛衣数据集·夹克衫ai
CV-杨帆5 小时前
ICLR 2026 LLM安全相关论文整理
人工智能·深度学习·安全
小程故事多_805 小时前
从零吃透Transformer核心,多头注意力、残差连接与前馈网络(大白话完整版)
人工智能·深度学习·架构·aigc·transformer