目标检测常见数据集格式

目标检测常见的数据集格式COCO、YOLO、VOC、DATA。

1、COCO

数据标注格式JSON,JSON文件中包含多个关键字段,如info、images、annotations等,分别存储了数据集的基本信息、图像信息和标注信息

COCO数据集的下载

官网地址:http://cocodataset.org/#download

2014年数据集的下载

train2014:http://images.cocodataset.org/zips/train2014.zip

val2014:http://images.cocodataset.org/zips/val2014.zip

http://msvocds.blob.core.windows.net/coco2014/train2014.zip

2017的数据集的下载

http://images.cocodataset.org/zips/train2017.zip

http://images.cocodataset.org/annotations/annotations_trainval2017.zip

http://images.cocodataset.org/zips/val2017.zip

http://images.cocodataset.org/annotations/stuff_annotations_trainval2017.zip

http://images.cocodataset.org/zips/test2017.zip

http://images.cocodataset.org/annotations/image_info_test2017.zip

2、YOLO

YOLO算法专用的数据集格式,其标签文件为TXT格式。

每个TXT文件对应一张图片,文件中包含了图片中所有目标的类别和边界框坐标。

TXT文件中的每一行代表一个目标,包括目标的类别编号和边界框的中心坐标(x_center, y_center)、宽度(w)和高度(h),这些值都是相对于整张图片的比例

3、VOC

标签格式XML,每个XML文件对应一张图片,文件中包含了图片中所有目标的位置(通过边界框的坐标表示)和类别信息。

XML文件中包含了图片的文件夹名、文件名、尺寸信息以及一个或多个目标对象的信息。每个目标对象的信息包括类别名、姿态、是否被部分遮挡、是否为难以辨识的物体等,以及边界框的坐标(xmin, ymin, xmax, ymax)

下载:

VOC2007:http://host.robots.ox.ac.uk/pascal/VOC/voc2007/index.html

train/val:http://host.robots.ox.ac.uk/pascal/VOC/voc2007/VOCtrainval_06-Nov-2007.tar

test:http://host.robots.ox.ac.uk/pascal/VOC/voc2007/VOCtest_06-Nov-2007.tar

VOC2012:http://host.robots.ox.ac.uk/pascal/VOC/voc2012/index.html

train/val:http://host.robots.ox.ac.uk/pascal/VOC/voc2012/VOCtrainval_11-May-2012.tar

4、DOTA

DOTA是一个遥感图像数据集,专门用于航空图像中的目标检测任务。

DOTA采用旋转框标注方式,以适应遥感图像中目标的任意方向。

标注格式:xml/txt 四点坐标标注

官网:

https://captain-whu.github.io/DOTA/dataset.html

相关推荐
初学小刘39 分钟前
深度学习:从图片数据到模型训练(十分类)
人工智能·深度学习
递归不收敛1 小时前
大语言模型(LLM)入门笔记:嵌入向量与位置信息
人工智能·笔记·语言模型
之墨_2 小时前
【大语言模型】—— 自注意力机制及其变体(交叉注意力、因果注意力、多头注意力)的代码实现
人工智能·语言模型·自然语言处理
从孑开始3 小时前
ManySpeech.MoonshineAsr 使用指南
人工智能·ai·c#·.net·私有化部署·语音识别·onnx·asr·moonshine
涛涛讲AI3 小时前
一段音频多段字幕,让音频能够流畅自然对应字幕 AI生成视频,扣子生成剪映视频草稿
人工智能·音视频·语音识别
可触的未来,发芽的智生3 小时前
新奇特:黑猫警长的纳米世界,忆阻器与神经网络的智慧
javascript·人工智能·python·神经网络·架构
WWZZ20253 小时前
快速上手大模型:机器学习2(一元线性回归、代价函数、梯度下降法)
人工智能·算法·机器学习·计算机视觉·机器人·大模型·slam
AKAMAI4 小时前
数据孤岛破局之战 :跨业务分析的难题攻坚
运维·人工智能·云计算
Chicheng_MA4 小时前
算能 CV184 智能相机整体方案介绍
人工智能·数码相机·算能
Element_南笙4 小时前
吴恩达新课程:Agentic AI(笔记2)
数据库·人工智能·笔记·python·深度学习·ui·自然语言处理