【目标检测】yolo的三种数据集格式

在YOLO目标检测中，常用的标签格式主要有三种：voc(xml)、coco(json)和yolo(txt)。每种格式都有其独特的优点和适用场景。

voc(xml)格式 ：XML格式因其良好的可读性和扩展性，在目标检测领域得到了广泛应用。它不仅能够存储目标的边界框信息，还能包含其他元数据信息，如图像来源、拍摄时间等。
coco(json)格式：JSON格式以其轻量级和易于解析的特点，成为许多现代目标检测数据集的首选。它支持多层嵌套结构，能够更灵活地表示复杂的目标关系。
yolo(txt)格式：YOLO算法专用的txt格式标签，简洁明了，直接包含目标的类别和边界框坐标。这种格式在YOLO系列算法的训练中非常高效。

因为我以后的项目大概率继续用的是txt格式，所以本文只写txt格式的相关内容，其他格式参考上面的两个链接。

1、yolo的txt格式

yolov5的比较简单，就是图片和标签分别两个文件夹中，并且自己分类，将图片与标签按照一定的比例区分成训练集和验证集。

txt的标签如下图所示：

第一列为目标类别，后面四个数字为** $x_center, y_center, w, h$ **，可以看到都是小于1的数字，是因为对应的整张图片的比例，所以就算图像被拉伸放缩，这种txt格式的标签也可以找到相应的目标。

使用makesense.ai（上一篇文章说过的一个超级强大的在线标注工具）标注之后直接输出的就是txt标签文件，分一下文件夹即可训练。

代码请教GPT

自己的数据集标注好，分好之后当然是用模型进行训练啦。

1、custom.yaml文件

仿照./data/文件夹下的yaml文件，自己写一个

这边的"path" 和"names"改成自己的，这里笔者的train_data放在和yolov5相同目录下。

然后按照官方用例跑，data 参数改为自己的custom.yaml：

复制代码

python train.py --data custom.yaml --epochs 300 --weights ./weights/yolov5s.pt --cfg yolov5s.yaml  --batch-size 128