目标检测数据集与制作

目标检测数据集与制作

VOC数据集

PASCAL VOC挑战赛(ThePASCALVisualObjectClasses)是一个世界级的计算机视觉挑战赛,PASCAL全称:Pattern Analysis,Statical Modeling and Computational Learning,是一个由欧盟资助的网络组织。PASCALVOc挑战赛主要包括以下几类:图像分类(Object Classification);目标检测(Object Detection),目标分割(Object Segmentation),动作识别(ActionClassification)等。

整个PASCAL VOC数据集有20个类别的信息。类别信息如下所示:

在学习VOC数据集之前我们需要了解voc数据集的结构信息

我们使用我之前Faster Rcnn项目中使用的VOC数据集对各个部分进行说明

  • Annotations:里面存放着所有图像的标注信息(使用的是xml文件来进行表示)

    复制代码
     <truncated>1</truncated>表示是否被截断。
     <difficult>0</difficult> 检测的难易程度
     <object>     代表有两个目标
      	<name>dog</name>
      	<pose>Left</pose>
      	<truncated>1</truncated>
      	<difficult>0</difficult>
      	<bndbox>
      		<xmin>48</xmin>
      		<ymin>240</ymin>
      		<xmax>195</xmax>
      		<ymax>371</ymax>
      	</bndbox>
      </object>
      <object>
      	<name>person</name>
      	<pose>Left</pose>
      	<truncated>1</truncated>
      	<difficult>0</difficult>
      	<bndbox>
      		<xmin>8</xmin>
      		<ymin>12</ymin>
      		<xmax>352</xmax>
      		<ymax>498</ymax>
      	</bndbox>
      </object>

Main里面包括了一些txt文件的信息:依次主要包括了下面的四个文件信息。

  • 测试集
  • 训练集
  • 训练集+验证集
  • 验证集

标注数据集

之前我使用的labelme生成的是json文件,这次使用labelimg来生成和voc数据集相同的xml文件信息。

使用流程:

  • 打开项目文件夹->data->predefined_classes.txt修改标注类别信息
  • 打开软件设置图像文件所在目录,以及标注文件保存目录
  • 标注图像,并保存
  • 若要修改源代码在项目的libs->labelFile.py文件中修改

先创建下面格式的文件夹信息

  1. 下载并使用labelIMG

pip install labelIMG

  1. 将目录切换到刚刚创建好的文件夹那里
  2. 使用命令打开标注软件进行标注信息。

labelIMG ./image ./class

  1. 设置标注文件的保存位置。
  1. 开始进行目标检测数据集的标注完成相关的操作步骤。
相关推荐
卷福同学1 小时前
【养虾日记】Openclaw操作浏览器自动化发文
人工智能·后端·算法
春日见1 小时前
如何入门端到端自动驾驶?
linux·人工智能·算法·机器学习·自动驾驶
光锥智能1 小时前
从自动驾驶到 AI 能力体系,元戎启行 GTC 发布基座模型新进展
人工智能
luoganttcc1 小时前
自动驾驶 世界模型 有哪些
人工智能·机器学习·自动驾驶
禁默2 小时前
光学与机器视觉:解锁“机器之眼”的核心密码-《第五届光学与机器视觉国际学术会议(ICOMV 2026)》
人工智能·计算机视觉·光学
深小乐2 小时前
不是DeepSeek V4!这两个神秘的 Hunter 模型竟然来自小米
人工智能
laozhao4322 小时前
科大讯飞中标教育管理应用升级开发项目
大数据·人工智能
rainbow7242442 小时前
AI人才简历评估选型:技术面试、代码评审与项目复盘的综合运用方案
人工智能·面试·职场和发展
张张123y2 小时前
RAG从0到1学习:技术架构、项目实践与面试指南
人工智能·python·学习·面试·架构·langchain·transformer
星爷AG I3 小时前
14-12 动作序列学习(AGI基础理论)
人工智能·学习·agi