【YOLOX】《YOLOX:Exceeding YOLO Series in 2021》

arXiv-2021


文章目录

  • [1 Background and Motivation](#1 Background and Motivation)
  • [2 Related Work](#2 Related Work)
  • [3 Advantages / Contributions](#3 Advantages / Contributions)
  • [4 Method](#4 Method)
  • [5 Experiments](#5 Experiments)
    • [5.1 Datasets and Metrics](#5.1 Datasets and Metrics)
  • [6 Conclusion(own)](#6 Conclusion(own))

1 Background and Motivation

2 Related Work

3 Advantages / Contributions

4 Method


深入浅出Yolo系列之Yolox核心基础完整讲解

(1)输入端,mosaic 和 mixup,最后 15 个 epochs 会关闭

(2)预测头

解耦头会收敛更快,精度也会更高,但会增加运算的复杂度

anchor free,以 640 输入为例,总预测数量 ( 20 ∗ 20 + 40 ∗ 40 + 80 ∗ 80 ) ∗ ( 80 + 1 + 4 ) = 8400 ∗ 85 (20*20 + 40*40 + 80*80) * (80 + 1 +4) = 8400* 85 (20∗20+40∗40+80∗80)∗(80+1+4)=8400∗85

anchor based,以 640 输入为例,总预测数量 3 ∗ ( 20 ∗ 20 + 40 ∗ 40 + 80 ∗ 80 ) ∗ ( 80 + 1 + 4 ) = 3 ∗ 8400 ∗ 85 3*(20*20 + 40*40 + 80*80) * (80 + 1 +4) = 3*8400* 85 3∗(20∗20+40∗40+80∗80)∗(80+1+4)=3∗8400∗85

正负样本分配:初步筛选、SimOTA

初步筛选

a. 根据中心点来判断:寻找anchor_box中心点,落在groundtruth_boxes矩形范围的所有anchors

b.根据目标框来判断:以groundtruth中心点为基准,设置边长为5的正方形,挑选在正方形内的所有锚框。

这一步还是有候选框或者说 anchor 的概念的

因为不同层金字塔特征图上的空间位置映射为原图,还是有大小的

精细筛选---SimOTA

a.初筛正样本信息提取

b.Loss 函数计算

c.cost 成本计算

d.SimOTA 求解

假设初步筛选从 8400 筛选到只剩 1000, simOTA中,会选 cost 最小的前 k 个 作为正样本

可能出现共用情况,一个正样本分配了多个 GT

选 cost 最小的

5 Experiments

5.1 Datasets and Metrics

6 Conclusion(own)

YOLOX作者刘松涛博士:高性能目标检测的最新实践


解耦的好处在于:在检测的过程中分类需要的特征和回归所需要的特征不同,所以在 Decoupled Head 中进行解耦处理后学习的过程会变得更加简单。


相关推荐
Vizio<1 小时前
基于CNN的猫狗识别(自定义CNN模型)
人工智能·笔记·深度学习·神经网络·cnn
山海不说话1 小时前
深度学习(第3章——亚像素卷积和可形变卷积)
图像处理·人工智能·pytorch·深度学习·目标检测·计算机视觉·超分辨率重建
-一杯为品-2 小时前
【深度学习】#12 计算机视觉
人工智能·深度学习·计算机视觉
蹦蹦跳跳真可爱5892 小时前
Python----神经网络(《Searching for MobileNetV3》论文概括和MobileNetV3网络)
人工智能·python·深度学习·神经网络
終不似少年遊*2 小时前
【从基础到模型网络】深度学习-语义分割-基础
网络·人工智能·深度学习·语义分割·卷积·上采样
想要成为计算机高手4 小时前
半成品的开源双系统VLA模型,OpenHelix-发表于2025.5.6
人工智能·深度学习·计算机视觉·自然语言处理·机器人·开源·vla
qq_368019664 小时前
人工智能、机器学习、深度学习定义与联系
人工智能·深度学习·机器学习
白熊1885 小时前
【计算机视觉】论文精读《基于改进YOLOv3的火灾检测与识别》
人工智能·yolo·计算机视觉
有Li5 小时前
联合建模组织学和分子标记用于癌症分类|文献速递-深度学习医疗AI最新文献
人工智能·深度学习·分类
乌旭5 小时前
开源GPU架构RISC-V VCIX的深度学习潜力测试:从RTL仿真到MNIST实战
人工智能·深度学习·stable diffusion·架构·aigc·midjourney·risc-v