目标检测数据集与制作

目标检测数据集与制作

VOC数据集

PASCAL VOC挑战赛(ThePASCALVisualObjectClasses)是一个世界级的计算机视觉挑战赛,PASCAL全称:Pattern Analysis,Statical Modeling and Computational Learning,是一个由欧盟资助的网络组织。PASCALVOc挑战赛主要包括以下几类:图像分类(Object Classification);目标检测(Object Detection),目标分割(Object Segmentation),动作识别(ActionClassification)等。

整个PASCAL VOC数据集有20个类别的信息。类别信息如下所示:

在学习VOC数据集之前我们需要了解voc数据集的结构信息

我们使用我之前Faster Rcnn项目中使用的VOC数据集对各个部分进行说明

  • Annotations:里面存放着所有图像的标注信息(使用的是xml文件来进行表示)

    复制代码
     <truncated>1</truncated>表示是否被截断。
     <difficult>0</difficult> 检测的难易程度
     <object>     代表有两个目标
      	<name>dog</name>
      	<pose>Left</pose>
      	<truncated>1</truncated>
      	<difficult>0</difficult>
      	<bndbox>
      		<xmin>48</xmin>
      		<ymin>240</ymin>
      		<xmax>195</xmax>
      		<ymax>371</ymax>
      	</bndbox>
      </object>
      <object>
      	<name>person</name>
      	<pose>Left</pose>
      	<truncated>1</truncated>
      	<difficult>0</difficult>
      	<bndbox>
      		<xmin>8</xmin>
      		<ymin>12</ymin>
      		<xmax>352</xmax>
      		<ymax>498</ymax>
      	</bndbox>
      </object>

Main里面包括了一些txt文件的信息:依次主要包括了下面的四个文件信息。

  • 测试集
  • 训练集
  • 训练集+验证集
  • 验证集

标注数据集

之前我使用的labelme生成的是json文件,这次使用labelimg来生成和voc数据集相同的xml文件信息。

使用流程:

  • 打开项目文件夹->data->predefined_classes.txt修改标注类别信息
  • 打开软件设置图像文件所在目录,以及标注文件保存目录
  • 标注图像,并保存
  • 若要修改源代码在项目的libs->labelFile.py文件中修改

先创建下面格式的文件夹信息

  1. 下载并使用labelIMG

pip install labelIMG

  1. 将目录切换到刚刚创建好的文件夹那里
  2. 使用命令打开标注软件进行标注信息。

labelIMG ./image ./class

  1. 设置标注文件的保存位置。
  1. 开始进行目标检测数据集的标注完成相关的操作步骤。
相关推荐
JavaGuide9 分钟前
比 iTerm2 更适合 Claude Code/Codex 的终端,我换成 Ghostty 了
人工智能·后端
threerocks20 分钟前
神级 Skill,作品个个儿爆,我开源了长期自用的手绘风格库
人工智能·aigc
小爷毛毛_卓寿杰2 小时前
我把一个 3B 模型塞进了 Xinference,然后它干掉了 DeepSeek V3.2
人工智能·开源·github
秦先生在广东2 小时前
Agent 闭环才是真正的护城河:Anthropic “300 个 Agent“ 背后被忽视的秘密
人工智能
Bigfish_coding2 小时前
前端转agent-【python】- 14 记忆系统优化:摘要与遗忘
人工智能
Bigfish_coding2 小时前
前端转agent-【python】-13 Ollama Python流式输出教程:stream=True 与 async 实践
人工智能
字节跳动数据库4 小时前
文章分享——相似函数处理方法
人工智能·后端·程序员
Bigfish_coding4 小时前
前端转agent-【python】-12 LangChain 入门实战:RAG + LCEL 链式调用
人工智能
程序员cxuan5 小时前
读懂 Claude Code 架构分析系列,第一篇,开始!
人工智能·后端·架构
饼干哥哥5 小时前
扣子3.0测评:我让 Codex 和 Claude Code 住同一个桌面,结果它们打架了!
人工智能·开源·代码规范