【深度学习项目】目标检测之YOLO系列-V4(二)

介绍

YOLOv4(You Only Look Once v4)是YOLO系列目标检测算法的又一个重要版本,它在2020年由Alexey Bochkovskiy、Chien-Yao Wang和Hong-Yuan Mark Liao提出。YOLOv4在保持实时性能的同时,进一步提升了检测精度,尤其是在小物体检测方面。以下是YOLOv4的主要特点和改进:

主要改进

  1. 增强的特征提取网络
  • CSPDarknet53:YOLOv4采用了CSPDarknet53作为其主干网络。CSPNet(Cross Stage Partial Network)通过分隔梯度路径来减少计算量并提高学习效率,同时引入了残差结构以促进信息流动。这种设计不仅提高了模型的准确性,还减少了所需的训练时间。
  1. 强大的颈部设计
  • SPP(Spatial Pyramid Pooling):空间金字塔池化层被用于捕捉不同尺度的上下文信息。
  • PANet(Path Aggregation Network):路径聚合网络增强了特征融合,促进了低层次的空间信息与高层次的语义信息之间的交流,从而改善了多尺度目标检测的能力。
  1. 先进的激活函数和正则化技术
  • Mish 激活函数:YOLOv4引入了Mish作为激活函数,相比ReLU,Mish可以提供更好的非线性映射能力,并有助于缓解梯度消失问题。
  • CIoU Loss:为了更精确地调整边界框的位置,YOLOv4使用了CIoU损失函数,该函数综合考虑了IoU、中心点距离以及长宽比差异。
  1. 数据增强
  • Mosaic Data Augmentation:YOLOv4引入了一种名为Mosaic的数据增强方法,这种方法将四张不同的图片拼接成一张大图进行训练,增加了样本多样性,有助于提高模型对复杂场景的理解。
  • Self-Adversarial Training (SAT):这是一种对抗性的自我训练机制,旨在使模型更加鲁棒,能够更好地应对测试时可能遇到的各种变化。
  1. Bag of Freebies 和 Bag of Specials
  • Bag of Freebies:指的是那些可以在不增加推理成本的情况下提升模型性能的技术,如CutMix、MixUp等。
  • Bag of Specials:包括了一系列专门用于优化检测任务的方法,比如上面提到的Mish激活函数、CIoU Loss等。

性能提升

YOLOv4在多个基准数据集上实现了优异的表现,特别是在COCO数据集上的平均精度(mAP)显著高于前代产品和其他竞争模型。此外,它仍然保持了极高的速度优势,能够在普通GPU上实现实时检测。

网络架构

  • CSPDarknet53:作为主干网络,负责提取图像特征。
  • SPP + PANet:构成"颈部",加强特征融合和多尺度表示。
  • YOLOv3 Head:最终输出预测结果的部分,保留了YOLOv3中有效的头部设计,但结合了上述改进点。

整体介绍

  • 虽然作者换了,但精髓没变
  • 如果CV界有劳模奖,一定非他莫属
  • 整体看还是那个味,细还是他细
  • 江湖传闻最高的武功:嫁衣神功

V4贡献

Bag of freebies(BOF)

Mosaic data augmentation

数据增强

Self-adversarial-training(SAT)

DropBlock

Label Smoothing


IOU损失

GIOU损失

DIOU损失

CIOU损失

DIOU-NMS

SOFT-NMS

Bag of specials(BOS)

SPPNet(Spatial Pyramid Pooling)

CSPNet(Cross Stage Partial Network)

CBAM

Spatial attention module

PAN(Path Aggregation Network)



Mish

Eliminate grid sensitivity

相关推荐
曦月逸霜1 小时前
啥是RAG 它能干什么?
人工智能·python·机器学习
AI医影跨模态组学1 小时前
Lancet Digit Health(IF=24.1)广东省人民医院刘再毅&南方医科大学南方医院梁莉等团队:基于可解释深度学习模型预测胶质瘤分子改变
人工智能·深度学习·论文·医学·医学影像·影像组学
CSND7401 小时前
YOLO resume断点续训(不能用官方的权重,是自己训练一半生成的last.pt)
深度学习·yolo·机器学习
AI医影跨模态组学2 小时前
J Clin Oncol(IF=43.4)美国Cedars-Sinai医学中心等团队:基于计算组织学人工智能的晚期胰腺癌化疗选择预测性生物标志物的开发与验证
人工智能·机器学习·论文·医学·医学影像·影像组学
温九味闻醉3 小时前
关于腾讯广告算法大赛2025项目分析3-重读
人工智能·机器学习
啦啦啦_99995 小时前
0. 深度学习课程大纲:
深度学习
AI医影跨模态组学7 小时前
Cancer Letters(IF=10.1)中山大学附属第六医院等团队:基于治疗前MRI影像的RCMIX模型预测MRI定义的cT4期直肠癌T分期下降
人工智能·机器学习·论文·医学·医学影像·影像组学
染指11108 小时前
3.AI大模型-token是什么-大模型底层运行机制
人工智能·算法·机器学习
stsdddd8 小时前
【YOLO算法多类别野生动物识别目标检测数据集】
人工智能·yolo·目标检测
南宫萧幕9 小时前
基于 Simulink 与 Python 联合仿真的 eVTOL 强化学习全链路实战
开发语言·人工智能·python·算法·机器学习·控制