简明 | Yolo-v3结构理解摘要

目录

整体结构

DBL

Res-n

Res-unit

concat

上采样


整体结构

网络主要包括两部分,一个部分是主干网络Darknet-53,一个部分使用特征金字塔(FPN)融合、加强特征提取并利用卷积进行预测。

DBL

DBL,即Darknetconv2d_BN_Leaky,就是conv+BN(Batch Normalization)+Leaky relu,三者共同构成组件。除最后一层卷积层外,BN和leaky relu与卷积层完整绑定。

Res-n

Res-n,即残差模块,n表示这个Res-block里含有多少个Res-unit。yolo-v3首次借鉴ResNet的残差结构,让网络更深,例如从v2的darknet-19到v3的darknet-53。http://t.csdnimg.cn/swIL4

Res-unit

Res-u,即残差单元,含有多个DBL,残差模块中含有一个或多个残差单元。

concat

concat,即拼接层,PyTorch中就是张量拼接,将Darknet中间层和后面的某一层的上采样进行拼接。拼接的操作和残差层add的操作是不一样的,拼接会扩充张量的维度,而add只是直接相加不会导致张量维度的改变。

上采样

上采样层,放大图片和增加图片的分辨率,将提取到的Feature Map进行放大, 从而以更高的分辨率进行显示图像。这里的图像放大,不是下采样的逆操作,通常通过双线性插值或转置卷积实现。

相关推荐
CoovallyAIHub2 天前
仿生学突破:SILD模型如何让无人机在电力线迷宫中发现“隐形威胁”
深度学习·算法·计算机视觉
CoovallyAIHub2 天前
从春晚机器人到零样本革命:YOLO26-Pose姿态估计实战指南
深度学习·算法·计算机视觉
CoovallyAIHub2 天前
Le-DETR:省80%预训练数据,这个实时检测Transformer刷新SOTA|Georgia Tech & 北交大
深度学习·算法·计算机视觉
CoovallyAIHub2 天前
强化学习凭什么比监督学习更聪明?RL的“聪明”并非来自算法,而是因为它学会了“挑食”
深度学习·算法·计算机视觉
CoovallyAIHub2 天前
YOLO-IOD深度解析:打破实时增量目标检测的三重知识冲突
深度学习·算法·计算机视觉
用户1474853079743 天前
AI-动手深度学习环境搭建-d2l
深度学习
OpenBayes贝式计算3 天前
解决视频模型痛点,TurboDiffusion 高效视频扩散生成系统;Google Streetview 涵盖多个国家的街景图像数据集
人工智能·深度学习·机器学习
OpenBayes贝式计算3 天前
OCR教程汇总丨DeepSeek/百度飞桨/华中科大等开源创新技术,实现OCR高精度、本地化部署
人工智能·深度学习·机器学习
在人间耕耘4 天前
HarmonyOS Vision Kit 视觉AI实战:把官方 Demo 改造成一套能长期复用的组件库
人工智能·深度学习·harmonyos
homelook4 天前
Transformer与电池管理系统(BMS)的结合是当前 智能电池管理 的前沿研究方向
人工智能·深度学习·transformer