大米杂质检测数据集(YOLO格式)

数据集概述

本数据集面向大米生产线中的异物(杂质)自动检测任务,包含5类常见混入杂质的目标检测标注,适用于基于深度学习的目标检测模型训练与评估,如YOLO系列、Faster R-CNN等主流框架。

数据集同时提供VOC格式(Pascal VOC XML)与YOLO格式(归一化中心坐标TXT)两套标注,可直接用于不同框架的训练流程,无需二次转换。


目录结构

复制代码
data/
├── JPEGImages/          # 原始图片(.jpg),共1007张
├── Annotations/         # VOC格式标注文件(.xml),共1007个
├── labels/              # YOLO格式标注文件(.txt),共1007个
│   └── classes.txt      # 类别名称列表(YOLO类别索引以此文件为准)
└── README.md

基本统计

项目 数值
图片总数 1007 张
标注文件总数 1007 × 2(XML + TXT)
图片分辨率 480 × 480 像素(RGB,3通道)
标注类别数 5 类
标注框总数 4164 个
是否含数据增强
标注形状 矩形边界框(Bounding Box)

类别说明

以下为5个检测类别及其标注统计,YOLO格式中的类别ID以labels/classes.txt文件中的顺序为准。

YOLO ID 类别名 中文含义 标注框数 占比
0 clod 土块 993 23.8%
1 corn 玉米粒 1173 28.2%
2 screw 螺丝 483 11.6%
3 stone 石块 311 7.5%
4 wheat 小麦粒 1204 28.9%

其中wheat(小麦粒)与corn(玉米粒)数量最多,stone(石块)样本量相对稀少,训练时建议关注类别不平衡问题,可考虑对stone、screw适度过采样或调整损失权重。


标注格式说明

VOC格式(Annotations/*.xml)

遵循Pascal VOC标准,核心字段如下:

复制代码
<annotation>
  <filename>xyxr_images_dami999.jpg</filename>
  <size>
    <width>480</width>
    <height>480</height>
    <depth>3</depth>
  </size>
  <object>
    <name>stone</name>          <!-- 类别名 -->
    <difficult>0</difficult>    <!-- 0=正常样本,1=困难样本 -->
    <bndbox>
      <xmin>46</xmin>           <!-- 左上角x -->
      <ymin>266</ymin>          <!-- 左上角y -->
      <xmax>88</xmax>           <!-- 右下角x -->
      <ymax>306</ymax>          <!-- 右下角y -->
    </bndbox>
  </object>
</annotation>

所有样本的difficult字段均为0,即无困难样本标记。

YOLO格式(labels/*.txt)

每行对应一个目标,格式为:

复制代码
<class_id> <x_center> <y_center> <width> <height>

坐标均为相对图片宽高的归一化值(范围0~1),中心点坐标+宽高表示。示例:

复制代码
3 0.139583 0.595833 0.087500 0.083333
0 0.364583 0.286458 0.137500 0.143750
4 0.768750 0.837500 0.091667 0.070833

类别ID与labels/classes.txt中的行号(从0开始)严格对应,与VOC格式XML中的类别名顺序无关,使用时请以classes.txt为准。


图片命名规则

所有图片、XML和TXT文件保持同名,仅后缀不同,命名规则为:

复制代码
xyxr_images_dami{编号}.jpg / .xml / .txt

编号范围从1到1007,三类文件一一对应,可直接按文件名匹配图片与标注。


使用建议

本数据集未预先划分训练集/验证集/测试集,使用时建议按8:1:1或7:2:1的比例自行随机划分,划分时注意保持各类别的比例均衡。由于stone类样本仅311个,建议在split时对其分布做单独验证,确保测试集中有足够的石块样本用于评估。

数据集本身未做任何增强处理,若训练效果不理想,可在训练pipeline中引入常规的几何变换(翻转、旋转、缩放裁剪)与色彩抖动,但不建议对目标形状语义有破坏性的增强(如极端透视变换)。

声明:本数据集仅提供准确且合理的标注,不对基于本数据集训练所得模型或权重文件的精度作任何保证。

相关推荐
GIS数据转换器2 小时前
延凡低成本低空无人机AI巡检方案
大数据·人工智能·信息可视化·数据挖掘·无人机
xiaoyaohou112 小时前
007、注意力机制改进(一):SE、CBAM、ECA模块原理与融合
yolo
流云枫2 小时前
把小说变成短视频/漫画——全流程技术复盘
人工智能
飞Link2 小时前
【AI大模型实战】万字长文肝透大语言模型(LLM):从底层原理解析到企业级Python项目落地
开发语言·人工智能·python·语言模型·自然语言处理
TechMasterPlus2 小时前
OpenClaw 源码深度解析:下一代 AI Agent 框架的架构设计与实现原理
人工智能
不完备智能2 小时前
🦌 DeerFlow 2.0 深度解析:字节跳动开源的"超级 Agent harness"架构揭秘
人工智能
阿木木AEcru2 小时前
DeepSeek 崩了 13 小时,不是故障,是 V4 在换引擎
人工智能
小小工匠2 小时前
Superpowers - 09 从构思到落地:如何用「计划编写与任务粒度」驾驭 AI 时代的软件开发
人工智能·skills·superpowers
阿聪谈架构2 小时前
第07章(下):LangGraph 工作流进阶 —— 检查点、人工介入与多 Agent 协作
人工智能·后端