数据集概述
本数据集面向大米生产线中的异物(杂质)自动检测任务,包含5类常见混入杂质的目标检测标注,适用于基于深度学习的目标检测模型训练与评估,如YOLO系列、Faster R-CNN等主流框架。
数据集同时提供VOC格式(Pascal VOC XML)与YOLO格式(归一化中心坐标TXT)两套标注,可直接用于不同框架的训练流程,无需二次转换。
目录结构
data/
├── JPEGImages/ # 原始图片(.jpg),共1007张
├── Annotations/ # VOC格式标注文件(.xml),共1007个
├── labels/ # YOLO格式标注文件(.txt),共1007个
│ └── classes.txt # 类别名称列表(YOLO类别索引以此文件为准)
└── README.md
基本统计
| 项目 | 数值 |
|---|---|
| 图片总数 | 1007 张 |
| 标注文件总数 | 1007 × 2(XML + TXT) |
| 图片分辨率 | 480 × 480 像素(RGB,3通道) |
| 标注类别数 | 5 类 |
| 标注框总数 | 4164 个 |
| 是否含数据增强 | 否 |
| 标注形状 | 矩形边界框(Bounding Box) |
类别说明
以下为5个检测类别及其标注统计,YOLO格式中的类别ID以labels/classes.txt文件中的顺序为准。
| YOLO ID | 类别名 | 中文含义 | 标注框数 | 占比 |
|---|---|---|---|---|
| 0 | clod | 土块 | 993 | 23.8% |
| 1 | corn | 玉米粒 | 1173 | 28.2% |
| 2 | screw | 螺丝 | 483 | 11.6% |
| 3 | stone | 石块 | 311 | 7.5% |
| 4 | wheat | 小麦粒 | 1204 | 28.9% |
其中wheat(小麦粒)与corn(玉米粒)数量最多,stone(石块)样本量相对稀少,训练时建议关注类别不平衡问题,可考虑对stone、screw适度过采样或调整损失权重。
标注格式说明
VOC格式(Annotations/*.xml)
遵循Pascal VOC标准,核心字段如下:
<annotation>
<filename>xyxr_images_dami999.jpg</filename>
<size>
<width>480</width>
<height>480</height>
<depth>3</depth>
</size>
<object>
<name>stone</name> <!-- 类别名 -->
<difficult>0</difficult> <!-- 0=正常样本,1=困难样本 -->
<bndbox>
<xmin>46</xmin> <!-- 左上角x -->
<ymin>266</ymin> <!-- 左上角y -->
<xmax>88</xmax> <!-- 右下角x -->
<ymax>306</ymax> <!-- 右下角y -->
</bndbox>
</object>
</annotation>
所有样本的difficult字段均为0,即无困难样本标记。
YOLO格式(labels/*.txt)
每行对应一个目标,格式为:
<class_id> <x_center> <y_center> <width> <height>
坐标均为相对图片宽高的归一化值(范围0~1),中心点坐标+宽高表示。示例:
3 0.139583 0.595833 0.087500 0.083333
0 0.364583 0.286458 0.137500 0.143750
4 0.768750 0.837500 0.091667 0.070833
类别ID与labels/classes.txt中的行号(从0开始)严格对应,与VOC格式XML中的类别名顺序无关,使用时请以classes.txt为准。
图片命名规则
所有图片、XML和TXT文件保持同名,仅后缀不同,命名规则为:
xyxr_images_dami{编号}.jpg / .xml / .txt
编号范围从1到1007,三类文件一一对应,可直接按文件名匹配图片与标注。
使用建议
本数据集未预先划分训练集/验证集/测试集,使用时建议按8:1:1或7:2:1的比例自行随机划分,划分时注意保持各类别的比例均衡。由于stone类样本仅311个,建议在split时对其分布做单独验证,确保测试集中有足够的石块样本用于评估。
数据集本身未做任何增强处理,若训练效果不理想,可在训练pipeline中引入常规的几何变换(翻转、旋转、缩放裁剪)与色彩抖动,但不建议对目标形状语义有破坏性的增强(如极端透视变换)。
声明:本数据集仅提供准确且合理的标注,不对基于本数据集训练所得模型或权重文件的精度作任何保证。


