目标检测数据集与制作
VOC数据集
PASCAL VOC挑战赛(ThePASCALVisualObjectClasses)是一个世界级的计算机视觉挑战赛,PASCAL全称:Pattern Analysis,Statical Modeling and Computational Learning,是一个由欧盟资助的网络组织。PASCALVOc挑战赛主要包括以下几类:图像分类(Object Classification);目标检测(Object Detection),目标分割(Object Segmentation),动作识别(ActionClassification)等。
整个PASCAL VOC数据集有20个类别的信息。类别信息如下所示:
在学习VOC数据集之前我们需要了解voc数据集的结构信息
我们使用我之前Faster Rcnn项目中使用的VOC数据集对各个部分进行说明
-
Annotations:里面存放着所有图像的标注信息(使用的是xml文件来进行表示)
<truncated>1</truncated>表示是否被截断。 <difficult>0</difficult> 检测的难易程度 <object> 代表有两个目标 <name>dog</name> <pose>Left</pose> <truncated>1</truncated> <difficult>0</difficult> <bndbox> <xmin>48</xmin> <ymin>240</ymin> <xmax>195</xmax> <ymax>371</ymax> </bndbox> </object> <object> <name>person</name> <pose>Left</pose> <truncated>1</truncated> <difficult>0</difficult> <bndbox> <xmin>8</xmin> <ymin>12</ymin> <xmax>352</xmax> <ymax>498</ymax> </bndbox> </object>
Main里面包括了一些txt文件的信息:依次主要包括了下面的四个文件信息。
- 测试集
- 训练集
- 训练集+验证集
- 验证集
标注数据集
之前我使用的labelme生成的是json文件,这次使用labelimg来生成和voc数据集相同的xml文件信息。
使用流程:
- 打开项目文件夹->data->predefined_classes.txt修改标注类别信息
- 打开软件设置图像文件所在目录,以及标注文件保存目录
- 标注图像,并保存
- 若要修改源代码在项目的libs->labelFile.py文件中修改
先创建下面格式的文件夹信息
- 下载并使用labelIMG
pip install labelIMG
- 将目录切换到刚刚创建好的文件夹那里
- 使用命令打开标注软件进行标注信息。
labelIMG ./image ./class
- 设置标注文件的保存位置。
- 开始进行目标检测数据集的标注完成相关的操作步骤。