大米杂质检测数据集（YOLO格式）

数据集概述

本数据集面向大米生产线中的异物（杂质）自动检测任务，包含5类常见混入杂质的目标检测标注，适用于基于深度学习的目标检测模型训练与评估，如YOLO系列、Faster R-CNN等主流框架。

数据集同时提供VOC格式（Pascal VOC XML）与YOLO格式（归一化中心坐标TXT）两套标注，可直接用于不同框架的训练流程，无需二次转换。

目录结构

复制代码

data/
├── JPEGImages/          # 原始图片（.jpg），共1007张
├── Annotations/         # VOC格式标注文件（.xml），共1007个
├── labels/              # YOLO格式标注文件（.txt），共1007个
│   └── classes.txt      # 类别名称列表（YOLO类别索引以此文件为准）
└── README.md

基本统计

项目	数值
图片总数	1007 张
标注文件总数	1007 × 2（XML + TXT）
图片分辨率	480 × 480 像素（RGB，3通道）
标注类别数	5 类
标注框总数	4164 个
是否含数据增强	否
标注形状	矩形边界框（Bounding Box）

类别说明

以下为5个检测类别及其标注统计，YOLO格式中的类别ID以labels/classes.txt文件中的顺序为准。

YOLO ID	类别名	中文含义	标注框数	占比
0	clod	土块	993	23.8%
1	corn	玉米粒	1173	28.2%
2	screw	螺丝	483	11.6%
3	stone	石块	311	7.5%
4	wheat	小麦粒	1204	28.9%

其中wheat（小麦粒）与corn（玉米粒）数量最多，stone（石块）样本量相对稀少，训练时建议关注类别不平衡问题，可考虑对stone、screw适度过采样或调整损失权重。

标注格式说明

VOC格式（Annotations/*.xml）

遵循Pascal VOC标准，核心字段如下：

复制代码

<annotation>
  <filename>xyxr_images_dami999.jpg</filename>
  <size>
    <width>480</width>
    <height>480</height>
    <depth>3</depth>
  </size>
  <object>
    <name>stone</name>          <!-- 类别名 -->
    <difficult>0</difficult>    <!-- 0=正常样本，1=困难样本 -->
    <bndbox>
      <xmin>46</xmin>           <!-- 左上角x -->
      <ymin>266</ymin>          <!-- 左上角y -->
      <xmax>88</xmax>           <!-- 右下角x -->
      <ymax>306</ymax>          <!-- 右下角y -->
    </bndbox>
  </object>
</annotation>

所有样本的difficult字段均为0，即无困难样本标记。

YOLO格式（labels/*.txt）

每行对应一个目标，格式为：

复制代码

<class_id> <x_center> <y_center> <width> <height>

坐标均为相对图片宽高的归一化值（范围0~1），中心点坐标+宽高表示。示例：

复制代码

3 0.139583 0.595833 0.087500 0.083333
0 0.364583 0.286458 0.137500 0.143750
4 0.768750 0.837500 0.091667 0.070833

类别ID与labels/classes.txt中的行号（从0开始）严格对应，与VOC格式XML中的类别名顺序无关，使用时请以classes.txt为准。

图片命名规则

所有图片、XML和TXT文件保持同名，仅后缀不同，命名规则为：

复制代码

xyxr_images_dami{编号}.jpg / .xml / .txt

编号范围从1到1007，三类文件一一对应，可直接按文件名匹配图片与标注。

使用建议

本数据集未预先划分训练集/验证集/测试集，使用时建议按8:1:1或7:2:1的比例自行随机划分，划分时注意保持各类别的比例均衡。由于stone类样本仅311个，建议在split时对其分布做单独验证，确保测试集中有足够的石块样本用于评估。

数据集本身未做任何增强处理，若训练效果不理想，可在训练pipeline中引入常规的几何变换（翻转、旋转、缩放裁剪）与色彩抖动，但不建议对目标形状语义有破坏性的增强（如极端透视变换）。

声明：本数据集仅提供准确且合理的标注，不对基于本数据集训练所得模型或权重文件的精度作任何保证。