目标检测数据集与制作

目标检测数据集与制作

VOC数据集

PASCAL VOC挑战赛(ThePASCALVisualObjectClasses)是一个世界级的计算机视觉挑战赛,PASCAL全称:Pattern Analysis,Statical Modeling and Computational Learning,是一个由欧盟资助的网络组织。PASCALVOc挑战赛主要包括以下几类:图像分类(Object Classification);目标检测(Object Detection),目标分割(Object Segmentation),动作识别(ActionClassification)等。

整个PASCAL VOC数据集有20个类别的信息。类别信息如下所示:

在学习VOC数据集之前我们需要了解voc数据集的结构信息

我们使用我之前Faster Rcnn项目中使用的VOC数据集对各个部分进行说明

  • Annotations:里面存放着所有图像的标注信息(使用的是xml文件来进行表示)

    复制代码
     <truncated>1</truncated>表示是否被截断。
     <difficult>0</difficult> 检测的难易程度
     <object>     代表有两个目标
      	<name>dog</name>
      	<pose>Left</pose>
      	<truncated>1</truncated>
      	<difficult>0</difficult>
      	<bndbox>
      		<xmin>48</xmin>
      		<ymin>240</ymin>
      		<xmax>195</xmax>
      		<ymax>371</ymax>
      	</bndbox>
      </object>
      <object>
      	<name>person</name>
      	<pose>Left</pose>
      	<truncated>1</truncated>
      	<difficult>0</difficult>
      	<bndbox>
      		<xmin>8</xmin>
      		<ymin>12</ymin>
      		<xmax>352</xmax>
      		<ymax>498</ymax>
      	</bndbox>
      </object>

Main里面包括了一些txt文件的信息:依次主要包括了下面的四个文件信息。

  • 测试集
  • 训练集
  • 训练集+验证集
  • 验证集

标注数据集

之前我使用的labelme生成的是json文件,这次使用labelimg来生成和voc数据集相同的xml文件信息。

使用流程:

  • 打开项目文件夹->data->predefined_classes.txt修改标注类别信息
  • 打开软件设置图像文件所在目录,以及标注文件保存目录
  • 标注图像,并保存
  • 若要修改源代码在项目的libs->labelFile.py文件中修改

先创建下面格式的文件夹信息

  1. 下载并使用labelIMG

pip install labelIMG

  1. 将目录切换到刚刚创建好的文件夹那里
  2. 使用命令打开标注软件进行标注信息。

labelIMG ./image ./class

  1. 设置标注文件的保存位置。
  1. 开始进行目标检测数据集的标注完成相关的操作步骤。
相关推荐
数据存储张几秒前
人工智能绘画的进化:大模型图像生成能力横评
人工智能
福客AI智能客服10 分钟前
AI智能客服系统正在改变“服务是如何被完成的”
人工智能
数智工坊13 分钟前
R-CNN目标检测算法精读全解
网络·人工智能·深度学习·算法·目标检测·r语言·cnn
俊哥V19 分钟前
每日 AI 研究简报 · 2026-04-22
人工智能·ai
Are_You_Okkk_23 分钟前
非结构化文档破局:BeeParser+PandaWiki赋能车企技术资料规范化管理
大数据·人工智能·开源
南湖北漠30 分钟前
避免电子设备的电磁波干扰和电磁波互相干扰对我们生活的危害
网络·人工智能·计算机网络·其他·安全·生活
ZStack开发者社区31 分钟前
从 “制造” 到 “智造”,ZStack助力制造企业破局而上
人工智能·云计算·制造
王莎莎-MinerU34 分钟前
MinerU 生态全接入:LangChain、Dify、RAGFlow、LlamaIndex 六大框架完整集成指南(2026)
计算机视觉·chatgpt·langchain·pdf·github·aigc
科技峰行者36 分钟前
解析OpenClaw安全挑战及应对策略 构筑AI Agent安全新边界
网络·人工智能·科技·安全·aws·亚马逊·亚马逊云科技
MediaTea42 分钟前
Scikit-learn:一个最小机器学习工作流示例
人工智能·python·机器学习·scikit-learn