【深度学习项目】目标检测之YOLO系列-V4(二)

介绍

YOLOv4(You Only Look Once v4)是YOLO系列目标检测算法的又一个重要版本,它在2020年由Alexey Bochkovskiy、Chien-Yao Wang和Hong-Yuan Mark Liao提出。YOLOv4在保持实时性能的同时,进一步提升了检测精度,尤其是在小物体检测方面。以下是YOLOv4的主要特点和改进:

主要改进

  1. 增强的特征提取网络
  • CSPDarknet53:YOLOv4采用了CSPDarknet53作为其主干网络。CSPNet(Cross Stage Partial Network)通过分隔梯度路径来减少计算量并提高学习效率,同时引入了残差结构以促进信息流动。这种设计不仅提高了模型的准确性,还减少了所需的训练时间。
  1. 强大的颈部设计
  • SPP(Spatial Pyramid Pooling):空间金字塔池化层被用于捕捉不同尺度的上下文信息。
  • PANet(Path Aggregation Network):路径聚合网络增强了特征融合,促进了低层次的空间信息与高层次的语义信息之间的交流,从而改善了多尺度目标检测的能力。
  1. 先进的激活函数和正则化技术
  • Mish 激活函数:YOLOv4引入了Mish作为激活函数,相比ReLU,Mish可以提供更好的非线性映射能力,并有助于缓解梯度消失问题。
  • CIoU Loss:为了更精确地调整边界框的位置,YOLOv4使用了CIoU损失函数,该函数综合考虑了IoU、中心点距离以及长宽比差异。
  1. 数据增强
  • Mosaic Data Augmentation:YOLOv4引入了一种名为Mosaic的数据增强方法,这种方法将四张不同的图片拼接成一张大图进行训练,增加了样本多样性,有助于提高模型对复杂场景的理解。
  • Self-Adversarial Training (SAT):这是一种对抗性的自我训练机制,旨在使模型更加鲁棒,能够更好地应对测试时可能遇到的各种变化。
  1. Bag of Freebies 和 Bag of Specials
  • Bag of Freebies:指的是那些可以在不增加推理成本的情况下提升模型性能的技术,如CutMix、MixUp等。
  • Bag of Specials:包括了一系列专门用于优化检测任务的方法,比如上面提到的Mish激活函数、CIoU Loss等。

性能提升

YOLOv4在多个基准数据集上实现了优异的表现,特别是在COCO数据集上的平均精度(mAP)显著高于前代产品和其他竞争模型。此外,它仍然保持了极高的速度优势,能够在普通GPU上实现实时检测。

网络架构

  • CSPDarknet53:作为主干网络,负责提取图像特征。
  • SPP + PANet:构成"颈部",加强特征融合和多尺度表示。
  • YOLOv3 Head:最终输出预测结果的部分,保留了YOLOv3中有效的头部设计,但结合了上述改进点。

整体介绍

  • 虽然作者换了,但精髓没变
  • 如果CV界有劳模奖,一定非他莫属
  • 整体看还是那个味,细还是他细
  • 江湖传闻最高的武功:嫁衣神功

V4贡献

Bag of freebies(BOF)

Mosaic data augmentation

数据增强

Self-adversarial-training(SAT)

DropBlock

Label Smoothing


IOU损失

GIOU损失

DIOU损失

CIOU损失

DIOU-NMS

SOFT-NMS

Bag of specials(BOS)

SPPNet(Spatial Pyramid Pooling)

CSPNet(Cross Stage Partial Network)

CBAM

Spatial attention module

PAN(Path Aggregation Network)



Mish

Eliminate grid sensitivity

相关推荐
deephub3 小时前
基于图神经网络的大语言模型检索增强生成框架研究:面向知识图谱推理的优化与扩展
人工智能·深度学习·语言模型·知识图谱·图神经网络
睡觉狂魔er4 小时前
自动驾驶控制与规划——Project 2: 车辆横向控制
人工智能·机器学习·自动驾驶
♢.*4 小时前
自动驾驶2022-2024年论文汇总与解析
论文阅读·人工智能·计算机视觉·nlp·自动驾驶
程序猿000001号5 小时前
YOLOv11:目标检测的新高度
深度学习·yolo·目标检测
亿佛6 小时前
pure跟踪模拟 不算自动驾驶仿真
人工智能·机器学习
果冻人工智能6 小时前
人工智能大语言模型起源篇,低秩微调(LoRA)
人工智能·深度学习·语言模型
JiYH6 小时前
YOLO系列,从V1~V10,持续更新(Pytorch实现)
人工智能·pytorch·yolo
Milk夜雨6 小时前
机器学习一点基础
人工智能·机器学习
德林恩宝6 小时前
焦距与视差的关系及其对深度估计的影响
人工智能·数码相机·计算机视觉
一念之坤8 小时前
OpenCV的简单练习
人工智能·opencv·计算机视觉