【深度学习项目】目标检测之YOLO系列-V4(二)

介绍

YOLOv4(You Only Look Once v4)是YOLO系列目标检测算法的又一个重要版本,它在2020年由Alexey Bochkovskiy、Chien-Yao Wang和Hong-Yuan Mark Liao提出。YOLOv4在保持实时性能的同时,进一步提升了检测精度,尤其是在小物体检测方面。以下是YOLOv4的主要特点和改进:

主要改进

  1. 增强的特征提取网络
  • CSPDarknet53:YOLOv4采用了CSPDarknet53作为其主干网络。CSPNet(Cross Stage Partial Network)通过分隔梯度路径来减少计算量并提高学习效率,同时引入了残差结构以促进信息流动。这种设计不仅提高了模型的准确性,还减少了所需的训练时间。
  1. 强大的颈部设计
  • SPP(Spatial Pyramid Pooling):空间金字塔池化层被用于捕捉不同尺度的上下文信息。
  • PANet(Path Aggregation Network):路径聚合网络增强了特征融合,促进了低层次的空间信息与高层次的语义信息之间的交流,从而改善了多尺度目标检测的能力。
  1. 先进的激活函数和正则化技术
  • Mish 激活函数:YOLOv4引入了Mish作为激活函数,相比ReLU,Mish可以提供更好的非线性映射能力,并有助于缓解梯度消失问题。
  • CIoU Loss:为了更精确地调整边界框的位置,YOLOv4使用了CIoU损失函数,该函数综合考虑了IoU、中心点距离以及长宽比差异。
  1. 数据增强
  • Mosaic Data Augmentation:YOLOv4引入了一种名为Mosaic的数据增强方法,这种方法将四张不同的图片拼接成一张大图进行训练,增加了样本多样性,有助于提高模型对复杂场景的理解。
  • Self-Adversarial Training (SAT):这是一种对抗性的自我训练机制,旨在使模型更加鲁棒,能够更好地应对测试时可能遇到的各种变化。
  1. Bag of Freebies 和 Bag of Specials
  • Bag of Freebies:指的是那些可以在不增加推理成本的情况下提升模型性能的技术,如CutMix、MixUp等。
  • Bag of Specials:包括了一系列专门用于优化检测任务的方法,比如上面提到的Mish激活函数、CIoU Loss等。

性能提升

YOLOv4在多个基准数据集上实现了优异的表现,特别是在COCO数据集上的平均精度(mAP)显著高于前代产品和其他竞争模型。此外,它仍然保持了极高的速度优势,能够在普通GPU上实现实时检测。

网络架构

  • CSPDarknet53:作为主干网络,负责提取图像特征。
  • SPP + PANet:构成"颈部",加强特征融合和多尺度表示。
  • YOLOv3 Head:最终输出预测结果的部分,保留了YOLOv3中有效的头部设计,但结合了上述改进点。

整体介绍

  • 虽然作者换了,但精髓没变
  • 如果CV界有劳模奖,一定非他莫属
  • 整体看还是那个味,细还是他细
  • 江湖传闻最高的武功:嫁衣神功

V4贡献

Bag of freebies(BOF)

Mosaic data augmentation

数据增强

Self-adversarial-training(SAT)

DropBlock

Label Smoothing


IOU损失

GIOU损失

DIOU损失

CIOU损失

DIOU-NMS

SOFT-NMS

Bag of specials(BOS)

SPPNet(Spatial Pyramid Pooling)

CSPNet(Cross Stage Partial Network)

CBAM

Spatial attention module

PAN(Path Aggregation Network)



Mish

Eliminate grid sensitivity

相关推荐
mit6.82443 分钟前
[1Prompt1Story] 注意力机制增强 IPCA | 去噪神经网络 UNet | U型架构分步去噪
人工智能·深度学习·神经网络
Jina AI1 小时前
回归C++: 在GGUF上构建高效的向量模型
人工智能·算法·机器学习·数据挖掘·回归
Coovally AI模型快速验证1 小时前
YOLO、DarkNet和深度学习如何让自动驾驶看得清?
深度学习·算法·yolo·cnn·自动驾驶·transformer·无人机
科大饭桶2 小时前
昇腾AI自学Day2-- 深度学习基础工具与数学
人工智能·pytorch·python·深度学习·numpy
努力还债的学术吗喽2 小时前
2021 IEEE【论文精读】用GAN让音频隐写术骗过AI检测器 - 对抗深度学习的音频信息隐藏
人工智能·深度学习·生成对抗网络·密码学·音频·gan·隐写
weixin_507929914 小时前
第G7周:Semi-Supervised GAN 理论与实战
人工智能·pytorch·深度学习
试剂界的爱马仕5 小时前
胶质母细胞瘤对化疗的敏感性由磷脂酰肌醇3-激酶β选择性调控
人工智能·科技·算法·机器学习·ai写作
AI波克布林6 小时前
发文暴论!线性注意力is all you need!
人工智能·深度学习·神经网络·机器学习·注意力机制·线性注意力
张子夜 iiii6 小时前
机器学习算法系列专栏:主成分分析(PCA)降维算法(初学者)
人工智能·python·算法·机器学习
Blossom.1186 小时前
把 AI 推理塞进「 8 位 MCU 」——0.5 KB RAM 跑通关键词唤醒的魔幻之旅
人工智能·笔记·单片机·嵌入式硬件·深度学习·机器学习·搜索引擎