目标检测数据集与制作

目标检测数据集与制作

VOC数据集

PASCAL VOC挑战赛(ThePASCALVisualObjectClasses)是一个世界级的计算机视觉挑战赛,PASCAL全称:Pattern Analysis,Statical Modeling and Computational Learning,是一个由欧盟资助的网络组织。PASCALVOc挑战赛主要包括以下几类:图像分类(Object Classification);目标检测(Object Detection),目标分割(Object Segmentation),动作识别(ActionClassification)等。

整个PASCAL VOC数据集有20个类别的信息。类别信息如下所示:

在学习VOC数据集之前我们需要了解voc数据集的结构信息

我们使用我之前Faster Rcnn项目中使用的VOC数据集对各个部分进行说明

  • Annotations:里面存放着所有图像的标注信息(使用的是xml文件来进行表示)

    复制代码
     <truncated>1</truncated>表示是否被截断。
     <difficult>0</difficult> 检测的难易程度
     <object>     代表有两个目标
      	<name>dog</name>
      	<pose>Left</pose>
      	<truncated>1</truncated>
      	<difficult>0</difficult>
      	<bndbox>
      		<xmin>48</xmin>
      		<ymin>240</ymin>
      		<xmax>195</xmax>
      		<ymax>371</ymax>
      	</bndbox>
      </object>
      <object>
      	<name>person</name>
      	<pose>Left</pose>
      	<truncated>1</truncated>
      	<difficult>0</difficult>
      	<bndbox>
      		<xmin>8</xmin>
      		<ymin>12</ymin>
      		<xmax>352</xmax>
      		<ymax>498</ymax>
      	</bndbox>
      </object>

Main里面包括了一些txt文件的信息:依次主要包括了下面的四个文件信息。

  • 测试集
  • 训练集
  • 训练集+验证集
  • 验证集

标注数据集

之前我使用的labelme生成的是json文件,这次使用labelimg来生成和voc数据集相同的xml文件信息。

使用流程:

  • 打开项目文件夹->data->predefined_classes.txt修改标注类别信息
  • 打开软件设置图像文件所在目录,以及标注文件保存目录
  • 标注图像,并保存
  • 若要修改源代码在项目的libs->labelFile.py文件中修改

先创建下面格式的文件夹信息

  1. 下载并使用labelIMG

pip install labelIMG

  1. 将目录切换到刚刚创建好的文件夹那里
  2. 使用命令打开标注软件进行标注信息。

labelIMG ./image ./class

  1. 设置标注文件的保存位置。
  1. 开始进行目标检测数据集的标注完成相关的操作步骤。
相关推荐
XD742971636几秒前
科技晚报|2026年5月17日:AI 开始进入国家与企业制度层
人工智能·科技·企业数字化·科技晚报
十贝12 分钟前
agentmemory 安装与使用手册
人工智能
青稞社区.13 分钟前
直播预告!面向几何与运动理解的流式前馈 3D/4D 重建
人工智能·3d
HIT_Weston14 分钟前
85、【Agent】【OpenCode】bash 工具提示词(HEREDOC)
人工智能·agent·opencode
AI技术控17 分钟前
Transformer 的 Encoder 和 Decoder 模块介绍:从结构原理到大模型应用实践
人工智能·python·深度学习·自然语言处理·transformer
Codebee17 分钟前
日抛型软件的双链路设计——从"日抛"到"认知进化"的范式革命
人工智能
KaMeidebaby25 分钟前
卡梅德生物技术快报|单克隆抗体人源化 PEG 修饰质控方法体系构建与验证
服务器·前端·数据库·人工智能·算法·百度·新浪微博
LaughingZhu25 分钟前
Product Hunt 每日热榜 | 2026-05-16
人工智能·经验分享·深度学习·神经网络·产品运营
wuxinyan12326 分钟前
工业级大模型学习之路015:RAG零基础入门教程(第十一篇):系统重构与代码规范化
人工智能·python·学习·重构·rag