YOLO v7(学习笔记)

1.简介
  • 主要改进:现有的一些trick的集合以及模块重参化动态标签分配策略,最终在 5 FPS 到 160 FPS 范围内的速度和准确度都超过了所有已知的目标检测 器。
  • 当前目标检测主要的优化方向:更快更强的网络架构;更有效的特征集成方法;更准确的检测方法;更精确的损失函数 ;更有效的标签分配方法;更有效的训练方法。
2.网络结构
(1)input
  • 整体复用YOLO V5的预处理方式和相关源码,唯一需要注意的是,官方主要是在640×640和1280×1280这样的相对较大的图片上进行的训练和测试。
(2)backbone
  • 主要是使用ELAN(该版本模型并没有使用论文里提到的最复杂的E-ELAN结构) 和 MP 结构。该版本模型的激活函数使用的是Silu。

  • a.ELAN结构:

  • 通过控制最短最长的梯度路径,更深的网络可以有效地学习和收敛。作者提出ELAN结构。基于ELAN设计的E-ELAN 用expand、shuffle、merge cardinality来实现在不破坏原有梯度路径的情况下不断增强网络学习能力的能力。论文中相关的图如下,其中的cross stage connection 其实就是1×1卷积:

  • 简化如下:

  • MP 结构:

  • 需要注意backbone中的MP前后通道数是不变的。

(3)neck & head
  • 检测头整体结构和YOLOV5类似,仍然是anchor based 结构,仍然没有使用YOLOX 和YOLOV6 的解耦头(分类和检测)思路。
3.损失函数
  • 整体和YOLOV5 保持一致,分为坐标损失、目标置信度损失(GT就是训练阶段的普通iou)和分类损失三部分。其中目标置信度损失和分类损失采用BCEWithLogitsLoss(带log的二值交叉熵损失),坐标损失采用CIoU损失。
4.样本匹配策略
  • 主要是参考了YOLOV5 和YOLOV6使用的当下比较火的simOTA.

  • 训练前,会基于训练集中gt框,通过k-means聚类算法 ,先验获得9个从小到大排列的anchor框。(可选)

  • 将每个gt与9个anchor匹配:Yolov5为分别计算它与9种anchor的宽与宽的比值(较大的宽除以较小的宽,比值大于1,下面的高同样操作)、高与高的比值,在宽比值、高比值这2个比值中,取最大的一个比值,若这个比值小于设定的比值阈值,这个anchor的预测框就被称为正样本。一个gt可能与几个anchor均能匹配上(此时最大9个)。所以一个gt可能在不同的网络层上做预测训练,大大增加了正样本的数量,当然也会出现gt与所有anchor都匹配不上的情况,这样gt就会被当成背景,不参与训练,说明anchor框尺寸设计的不好。

  • 扩充正样本。根据gt框的中心位置,将最近的2个邻域网格也作为预测网格,也即一个groundtruth框可以由3个网格来预测;可以发现粗略估计正样本数相比前yolo系列,增加了三倍(此时最大27个匹配)。图下图浅黄色区域,其中实线是YOLO的真实网格,虚线是将一个网格四等分,如这个例子中,GT的中心在右下虚线网格,则扩充右和下真实网格也作为正样本。

  • 获取与当前gt有top10最大iou的prediction结果。将这top10 (5-15之间均可,并不敏感)iou进行sum,就为当前gt的k。k最小取1。

  • 根据损失函数计算每个GT和候选anchor损失(前期会加大分类损失权重,后面减低分类损失权重,如1:5->1:3),并保留损失最小的前K个。

  • 去掉同一个anchor被分配到多个GT的情况。

相关推荐
动物园猫10 小时前
金属外表多种生锈检测数据集分享(适用于YOLO系列深度学习分类检测任务)
深度学习·yolo·分类
weixin_5500831511 小时前
亚博智能K230跑YOLOv8实时目标检测模型识别,从模型训练→转换ONNX→kmodel→板子运行步骤识别代码和踩坑记录最终使用wifi转换到
yolo
爱吃肉的鹏13 小时前
[特殊字符] 基于全YOLO系列(含YOLO26)的行人重识别项目——只需一条命令!可做嫌疑人检测、特定人员检测、走失儿童检测!
yolo
小学生-山海14 小时前
【YOLO系列】基于YOLOv8/v11/v26+flask+fastdmin开发的目标检测系统
yolo·目标检测·flask
深度学习lover15 小时前
<数据集>yolo 缆绳识别<目标检测>
人工智能·python·yolo·目标检测·计算机视觉·缆绳识别
深度学习lover17 小时前
<数据集>yolo 瓜果蔬菜识别<目标检测>
人工智能·python·yolo·目标检测·计算机视觉·瓜果蔬菜识别
fl1768311 天前
yolo系列网络结构图visio格式合集包含yolov3-yolo26各个网络结构图
yolo
子午1 天前
校园课堂异常行为检测系统~Python+YOLOV8算法+深度学习+模型训练+人工智能
人工智能·python·yolo
子午2 天前
基于YOLO的水稻害虫检测系统~Python+yolov8算法+深度学习+人工智能+模型训练
人工智能·python·yolo
深度学习lover2 天前
<数据集>yolo 笔识别<目标检测>
人工智能·python·yolo·目标检测·计算机视觉·笔识别