《------往期经典推荐------》
二、机器学习实战专栏【链接】 ,已更新31期,欢迎关注,持续更新中~~
三、深度学习【Pytorch】专栏【链接】
四、【Stable Diffusion绘画系列】专栏【链接】
五、YOLOv8改进专栏【链接】,持续更新中~~
六、YOLO性能对比专栏【链接】,持续更新中~
《------正文------》
目录
- 引言
- [什么是Bounding Box?](#什么是Bounding Box?)
- 边界框格式
- [1. Pascal VOC数据集格式](#1. Pascal VOC数据集格式)
- [2. COCO数据集格式](#2. COCO数据集格式)
- [3. CXCYWH格式](#3. CXCYWH格式)
- [4. YOLO边界框格式(标准化cxcywh格式)](#4. YOLO边界框格式(标准化cxcywh格式))
引言
Bounding Box是目标检测中的一个基本概念。它们用于定义对象在图像中的位置。边界框本质上是一个包围对象的矩形,帮助模型识别和定位它。虽然边界框的概念很简单,但它们在数据中的表示方式可能会有所不同。在这篇博客中,我们将探讨什么是边界框,为什么它们很重要,以及用于存储它们的不同格式。
什么是Bounding Box?
边界框由其位置和大小定义。它通常由一组坐标组成,这些坐标指示矩形的位置和大小。深度学习模型使用这些坐标可以:
- 识别对象类别(例如,狗、猫)。
- 确定对象在图像中的位置。
边界框广泛用于以下应用:
- 自动驾驶汽车(检测行人、车辆和交通标志)。
- 医学成像(定位肿瘤或异常)。
- 零售(跟踪货架上的物品)。
边界框格式
1. Pascal VOC数据集格式
在这里创建边界框,需要2个点的坐标
这里xmin和ymin表示左上角,这意味着边界框的起始坐标,xmax和ymax表示边界框的右下角。
在torch vision API中,我们将这种格式称为xyxy
2. COCO数据集格式
在这里创建一个边界框,我们需要(xmin,ymin,width和height)
这里xmin和ymin表示左上角,表示边框的起始坐标,width和height表示边框的宽度和高度
在torch vision API中,我们将这种格式称为xywh
3. CXCYWH格式
这次我们将使用边界框的中心坐标、宽度和高度
来创建边界框
在torch vision API中,我们将这种格式称为cxcywh
4. YOLO边界框格式(标准化cxcywh格式)
在这里,我们将中心坐标、宽度和高度
每个值分别除以图像的宽度和高度进行归一化。
所以cxcywh格式看起来像这样
好了,这篇文章就介绍到这里,喜欢的小伙伴感谢给点个赞和关注,更多精彩内容持续更新~~
关于本篇文章大家有任何建议或意见,欢迎在评论区留言交流!