大米杂质检测数据集(YOLO格式)

数据集概述

本数据集面向大米生产线中的异物(杂质)自动检测任务,包含5类常见混入杂质的目标检测标注,适用于基于深度学习的目标检测模型训练与评估,如YOLO系列、Faster R-CNN等主流框架。

数据集同时提供VOC格式(Pascal VOC XML)与YOLO格式(归一化中心坐标TXT)两套标注,可直接用于不同框架的训练流程,无需二次转换。


目录结构

复制代码
data/
├── JPEGImages/          # 原始图片(.jpg),共1007张
├── Annotations/         # VOC格式标注文件(.xml),共1007个
├── labels/              # YOLO格式标注文件(.txt),共1007个
│   └── classes.txt      # 类别名称列表(YOLO类别索引以此文件为准)
└── README.md

基本统计

项目 数值
图片总数 1007 张
标注文件总数 1007 × 2(XML + TXT)
图片分辨率 480 × 480 像素(RGB,3通道)
标注类别数 5 类
标注框总数 4164 个
是否含数据增强
标注形状 矩形边界框(Bounding Box)

类别说明

以下为5个检测类别及其标注统计,YOLO格式中的类别ID以labels/classes.txt文件中的顺序为准。

YOLO ID 类别名 中文含义 标注框数 占比
0 clod 土块 993 23.8%
1 corn 玉米粒 1173 28.2%
2 screw 螺丝 483 11.6%
3 stone 石块 311 7.5%
4 wheat 小麦粒 1204 28.9%

其中wheat(小麦粒)与corn(玉米粒)数量最多,stone(石块)样本量相对稀少,训练时建议关注类别不平衡问题,可考虑对stone、screw适度过采样或调整损失权重。


标注格式说明

VOC格式(Annotations/*.xml)

遵循Pascal VOC标准,核心字段如下:

复制代码
<annotation>
  <filename>xyxr_images_dami999.jpg</filename>
  <size>
    <width>480</width>
    <height>480</height>
    <depth>3</depth>
  </size>
  <object>
    <name>stone</name>          <!-- 类别名 -->
    <difficult>0</difficult>    <!-- 0=正常样本,1=困难样本 -->
    <bndbox>
      <xmin>46</xmin>           <!-- 左上角x -->
      <ymin>266</ymin>          <!-- 左上角y -->
      <xmax>88</xmax>           <!-- 右下角x -->
      <ymax>306</ymax>          <!-- 右下角y -->
    </bndbox>
  </object>
</annotation>

所有样本的difficult字段均为0,即无困难样本标记。

YOLO格式(labels/*.txt)

每行对应一个目标,格式为:

复制代码
<class_id> <x_center> <y_center> <width> <height>

坐标均为相对图片宽高的归一化值(范围0~1),中心点坐标+宽高表示。示例:

复制代码
3 0.139583 0.595833 0.087500 0.083333
0 0.364583 0.286458 0.137500 0.143750
4 0.768750 0.837500 0.091667 0.070833

类别ID与labels/classes.txt中的行号(从0开始)严格对应,与VOC格式XML中的类别名顺序无关,使用时请以classes.txt为准。


图片命名规则

所有图片、XML和TXT文件保持同名,仅后缀不同,命名规则为:

复制代码
xyxr_images_dami{编号}.jpg / .xml / .txt

编号范围从1到1007,三类文件一一对应,可直接按文件名匹配图片与标注。


使用建议

本数据集未预先划分训练集/验证集/测试集,使用时建议按8:1:1或7:2:1的比例自行随机划分,划分时注意保持各类别的比例均衡。由于stone类样本仅311个,建议在split时对其分布做单独验证,确保测试集中有足够的石块样本用于评估。

数据集本身未做任何增强处理,若训练效果不理想,可在训练pipeline中引入常规的几何变换(翻转、旋转、缩放裁剪)与色彩抖动,但不建议对目标形状语义有破坏性的增强(如极端透视变换)。

声明:本数据集仅提供准确且合理的标注,不对基于本数据集训练所得模型或权重文件的精度作任何保证。

相关推荐
常宇杏起在1 小时前
AI安全专项:AI云服务的安全风险与防护策略
人工智能
cooldog123pp1 小时前
cplex完全安装手册,适配matlab和python!
人工智能·python·matlab·cplex
mimu34561 小时前
做PPT方案适合搭配哪些办公效率工具
人工智能
蓝速科技1 小时前
蓝速科技 AI 数字人部署与交互实战指南
人工智能·科技·交互
雪隐1 小时前
个人电脑玩AI-03让5060 Ti给你打工——paddleOCR
人工智能·后端
Coffeeee1 小时前
Codachi — 藏在 Claude Code 状态栏里的电子宠物
人工智能·程序员·claude
张某布响丸辣1 小时前
Spring AI 极简入门:Java 开发者快速上手 AI 开发
java·人工智能·spring·springai
Deepoch1 小时前
VLA多模态架构加持 采摘机器人实现精细化智能采收
人工智能·机器人·开发板·具身模型·deepoc·采摘
橘子星1 小时前
基于 Vite 的多模态生图前端工程实践
前端·javascript·人工智能
谁似人间西林客1 小时前
工业AI原生企业是什么?制造业智能化升级的新路径
大数据·人工智能·ai-native