目标检测数据集与制作

目标检测数据集与制作

VOC数据集

PASCAL VOC挑战赛(ThePASCALVisualObjectClasses)是一个世界级的计算机视觉挑战赛,PASCAL全称:Pattern Analysis,Statical Modeling and Computational Learning,是一个由欧盟资助的网络组织。PASCALVOc挑战赛主要包括以下几类:图像分类(Object Classification);目标检测(Object Detection),目标分割(Object Segmentation),动作识别(ActionClassification)等。

整个PASCAL VOC数据集有20个类别的信息。类别信息如下所示:

在学习VOC数据集之前我们需要了解voc数据集的结构信息

我们使用我之前Faster Rcnn项目中使用的VOC数据集对各个部分进行说明

  • Annotations:里面存放着所有图像的标注信息(使用的是xml文件来进行表示)

    复制代码
     <truncated>1</truncated>表示是否被截断。
     <difficult>0</difficult> 检测的难易程度
     <object>     代表有两个目标
      	<name>dog</name>
      	<pose>Left</pose>
      	<truncated>1</truncated>
      	<difficult>0</difficult>
      	<bndbox>
      		<xmin>48</xmin>
      		<ymin>240</ymin>
      		<xmax>195</xmax>
      		<ymax>371</ymax>
      	</bndbox>
      </object>
      <object>
      	<name>person</name>
      	<pose>Left</pose>
      	<truncated>1</truncated>
      	<difficult>0</difficult>
      	<bndbox>
      		<xmin>8</xmin>
      		<ymin>12</ymin>
      		<xmax>352</xmax>
      		<ymax>498</ymax>
      	</bndbox>
      </object>

Main里面包括了一些txt文件的信息:依次主要包括了下面的四个文件信息。

  • 测试集
  • 训练集
  • 训练集+验证集
  • 验证集

标注数据集

之前我使用的labelme生成的是json文件,这次使用labelimg来生成和voc数据集相同的xml文件信息。

使用流程:

  • 打开项目文件夹->data->predefined_classes.txt修改标注类别信息
  • 打开软件设置图像文件所在目录,以及标注文件保存目录
  • 标注图像,并保存
  • 若要修改源代码在项目的libs->labelFile.py文件中修改

先创建下面格式的文件夹信息

  1. 下载并使用labelIMG

pip install labelIMG

  1. 将目录切换到刚刚创建好的文件夹那里
  2. 使用命令打开标注软件进行标注信息。

labelIMG ./image ./class

  1. 设置标注文件的保存位置。
  1. 开始进行目标检测数据集的标注完成相关的操作步骤。
相关推荐
帅次4 分钟前
系统分析师-计算机系统-输入输出系统
人工智能·分布式·深度学习·神经网络·架构·系统架构·硬件架构
AndrewHZ33 分钟前
【图像处理基石】如何入门大规模三维重建?
人工智能·深度学习·大模型·llm·三维重建·立体视觉·大规模三维重建
5G行业应用37 分钟前
【赠书福利,回馈公号读者】《智慧城市与智能网联汽车,融合创新发展之路》
人工智能·汽车·智慧城市
悟空胆好小1 小时前
分音塔科技(BABEL Technology) 的公司背景、股权构成、产品类型及技术能力的全方位解读
网络·人工智能·科技·嵌入式硬件
探讨探讨AGV1 小时前
以科技赋能未来,科聪持续支持青年创新实践 —— 第七届“科聪杯”浙江省大学生智能机器人创意竞赛圆满落幕
人工智能·科技·机器人
cwn_1 小时前
回归(多项式回归)
人工智能·机器学习·数据挖掘·回归
聚客AI2 小时前
🔥 大模型开发进阶:基于LangChain的异步流式响应与性能优化
人工智能·langchain·agent
CareyWYR2 小时前
每周AI论文速递(250707-250711)
人工智能
AI街潜水的八角2 小时前
深度学习图像分类数据集—五种电器识别分类
人工智能·深度学习·分类
众链网络2 小时前
AI进化论08:机器学习的崛起——数据和算法的“二人转”,AI“闷声发大财”
人工智能·算法·机器学习