【深度学习项目】目标检测之YOLO系列-V4(二)

介绍

YOLOv4(You Only Look Once v4)是YOLO系列目标检测算法的又一个重要版本,它在2020年由Alexey Bochkovskiy、Chien-Yao Wang和Hong-Yuan Mark Liao提出。YOLOv4在保持实时性能的同时,进一步提升了检测精度,尤其是在小物体检测方面。以下是YOLOv4的主要特点和改进:

主要改进

  1. 增强的特征提取网络
  • CSPDarknet53:YOLOv4采用了CSPDarknet53作为其主干网络。CSPNet(Cross Stage Partial Network)通过分隔梯度路径来减少计算量并提高学习效率,同时引入了残差结构以促进信息流动。这种设计不仅提高了模型的准确性,还减少了所需的训练时间。
  1. 强大的颈部设计
  • SPP(Spatial Pyramid Pooling):空间金字塔池化层被用于捕捉不同尺度的上下文信息。
  • PANet(Path Aggregation Network):路径聚合网络增强了特征融合,促进了低层次的空间信息与高层次的语义信息之间的交流,从而改善了多尺度目标检测的能力。
  1. 先进的激活函数和正则化技术
  • Mish 激活函数:YOLOv4引入了Mish作为激活函数,相比ReLU,Mish可以提供更好的非线性映射能力,并有助于缓解梯度消失问题。
  • CIoU Loss:为了更精确地调整边界框的位置,YOLOv4使用了CIoU损失函数,该函数综合考虑了IoU、中心点距离以及长宽比差异。
  1. 数据增强
  • Mosaic Data Augmentation:YOLOv4引入了一种名为Mosaic的数据增强方法,这种方法将四张不同的图片拼接成一张大图进行训练,增加了样本多样性,有助于提高模型对复杂场景的理解。
  • Self-Adversarial Training (SAT):这是一种对抗性的自我训练机制,旨在使模型更加鲁棒,能够更好地应对测试时可能遇到的各种变化。
  1. Bag of Freebies 和 Bag of Specials
  • Bag of Freebies:指的是那些可以在不增加推理成本的情况下提升模型性能的技术,如CutMix、MixUp等。
  • Bag of Specials:包括了一系列专门用于优化检测任务的方法,比如上面提到的Mish激活函数、CIoU Loss等。

性能提升

YOLOv4在多个基准数据集上实现了优异的表现,特别是在COCO数据集上的平均精度(mAP)显著高于前代产品和其他竞争模型。此外,它仍然保持了极高的速度优势,能够在普通GPU上实现实时检测。

网络架构

  • CSPDarknet53:作为主干网络,负责提取图像特征。
  • SPP + PANet:构成"颈部",加强特征融合和多尺度表示。
  • YOLOv3 Head:最终输出预测结果的部分,保留了YOLOv3中有效的头部设计,但结合了上述改进点。

整体介绍

  • 虽然作者换了,但精髓没变
  • 如果CV界有劳模奖,一定非他莫属
  • 整体看还是那个味,细还是他细
  • 江湖传闻最高的武功:嫁衣神功

V4贡献

Bag of freebies(BOF)

Mosaic data augmentation

数据增强

Self-adversarial-training(SAT)

DropBlock

Label Smoothing


IOU损失

GIOU损失

DIOU损失

CIOU损失

DIOU-NMS

SOFT-NMS

Bag of specials(BOS)

SPPNet(Spatial Pyramid Pooling)

CSPNet(Cross Stage Partial Network)

CBAM

Spatial attention module

PAN(Path Aggregation Network)



Mish

Eliminate grid sensitivity

相关推荐
ZCXZ12385296a31 分钟前
YOLOv26在水果图像识别与分类中的应用:苹果、猕猴桃、橙子和红毛丹的检测研究
yolo·分类·数据挖掘
我有医保我先冲2 小时前
AI 时代 “任务完成“ 与 “专业能力“ 的区分:理论基础、行业影响与个人发展策略
人工智能·python·机器学习
林深现海2 小时前
【刘二大人】PyTorch深度学习实践笔记 —— 第一集:深度学习全景概述(超详细版)
pytorch·笔记·深度学习
szxinmai主板定制专家2 小时前
基于 PC 的控制技术+ethercat+linux实时系统,助力追踪标签规模化生产,支持国产化
arm开发·人工智能·嵌入式硬件·yolo·fpga开发
莱茶荼菜3 小时前
yolo26 阅读笔记
人工智能·笔记·深度学习·ai·yolo26
Dingdangcat864 小时前
【YOLOv8改进实战】使用Ghost模块优化P2结构提升涂胶缺陷检测精度_1
人工智能·yolo·目标跟踪
qwy7152292581635 小时前
10-图像的翻转
人工智能·opencv·计算机视觉
lovod6 小时前
视觉SLAM十四讲合集
计算机视觉·slam·视觉slam·g2o·ba·位姿图
闵帆6 小时前
反演学习器面临的鸿沟
人工智能·学习·机器学习
阿正的梦工坊7 小时前
Megatron中--train-iters和--max_epochs两个参数介绍
人工智能·深度学习·自然语言处理