大米杂质检测数据集(YOLO格式)

数据集概述

本数据集面向大米生产线中的异物(杂质)自动检测任务,包含5类常见混入杂质的目标检测标注,适用于基于深度学习的目标检测模型训练与评估,如YOLO系列、Faster R-CNN等主流框架。

数据集同时提供VOC格式(Pascal VOC XML)与YOLO格式(归一化中心坐标TXT)两套标注,可直接用于不同框架的训练流程,无需二次转换。


目录结构

复制代码
data/
├── JPEGImages/          # 原始图片(.jpg),共1007张
├── Annotations/         # VOC格式标注文件(.xml),共1007个
├── labels/              # YOLO格式标注文件(.txt),共1007个
│   └── classes.txt      # 类别名称列表(YOLO类别索引以此文件为准)
└── README.md

基本统计

项目 数值
图片总数 1007 张
标注文件总数 1007 × 2(XML + TXT)
图片分辨率 480 × 480 像素(RGB,3通道)
标注类别数 5 类
标注框总数 4164 个
是否含数据增强
标注形状 矩形边界框(Bounding Box)

类别说明

以下为5个检测类别及其标注统计,YOLO格式中的类别ID以labels/classes.txt文件中的顺序为准。

YOLO ID 类别名 中文含义 标注框数 占比
0 clod 土块 993 23.8%
1 corn 玉米粒 1173 28.2%
2 screw 螺丝 483 11.6%
3 stone 石块 311 7.5%
4 wheat 小麦粒 1204 28.9%

其中wheat(小麦粒)与corn(玉米粒)数量最多,stone(石块)样本量相对稀少,训练时建议关注类别不平衡问题,可考虑对stone、screw适度过采样或调整损失权重。


标注格式说明

VOC格式(Annotations/*.xml)

遵循Pascal VOC标准,核心字段如下:

复制代码
<annotation>
  <filename>xyxr_images_dami999.jpg</filename>
  <size>
    <width>480</width>
    <height>480</height>
    <depth>3</depth>
  </size>
  <object>
    <name>stone</name>          <!-- 类别名 -->
    <difficult>0</difficult>    <!-- 0=正常样本,1=困难样本 -->
    <bndbox>
      <xmin>46</xmin>           <!-- 左上角x -->
      <ymin>266</ymin>          <!-- 左上角y -->
      <xmax>88</xmax>           <!-- 右下角x -->
      <ymax>306</ymax>          <!-- 右下角y -->
    </bndbox>
  </object>
</annotation>

所有样本的difficult字段均为0,即无困难样本标记。

YOLO格式(labels/*.txt)

每行对应一个目标,格式为:

复制代码
<class_id> <x_center> <y_center> <width> <height>

坐标均为相对图片宽高的归一化值(范围0~1),中心点坐标+宽高表示。示例:

复制代码
3 0.139583 0.595833 0.087500 0.083333
0 0.364583 0.286458 0.137500 0.143750
4 0.768750 0.837500 0.091667 0.070833

类别ID与labels/classes.txt中的行号(从0开始)严格对应,与VOC格式XML中的类别名顺序无关,使用时请以classes.txt为准。


图片命名规则

所有图片、XML和TXT文件保持同名,仅后缀不同,命名规则为:

复制代码
xyxr_images_dami{编号}.jpg / .xml / .txt

编号范围从1到1007,三类文件一一对应,可直接按文件名匹配图片与标注。


使用建议

本数据集未预先划分训练集/验证集/测试集,使用时建议按8:1:1或7:2:1的比例自行随机划分,划分时注意保持各类别的比例均衡。由于stone类样本仅311个,建议在split时对其分布做单独验证,确保测试集中有足够的石块样本用于评估。

数据集本身未做任何增强处理,若训练效果不理想,可在训练pipeline中引入常规的几何变换(翻转、旋转、缩放裁剪)与色彩抖动,但不建议对目标形状语义有破坏性的增强(如极端透视变换)。

声明:本数据集仅提供准确且合理的标注,不对基于本数据集训练所得模型或权重文件的精度作任何保证。

相关推荐
生成论实验室4 分钟前
《事件关系阴阳博弈动力学:识势应势之道》第四篇:降U动力学——认知确定度的自驱演化
人工智能·科技·神经网络·算法·架构
不懂的浪漫10 分钟前
把 AI Skill 做成系统:路由、领域技能、自我复盘和进化飞轮
人工智能·ai·skill
等风来不如迎风去17 分钟前
【win11】最佳性能:fix 没有壁纸,一直黑屏
网络·人工智能
云云只是个程序马喽20 分钟前
AI漫剧创作系统开发定制指南
人工智能·小程序·php
Elastic 中国社区官方博客39 分钟前
Elastic 和 Cursor 合作 加速 上下文工程 与 coding agents
大数据·人工智能·elasticsearch·搜索引擎·全文检索
迦南的迦 亚索的索41 分钟前
AI_12_Dify_平台介绍
人工智能
HIT_Weston44 分钟前
68、【Agent】【OpenCode】用户对话提示词(任务执行流程)
人工智能·agent·opencode
ting94520001 小时前
Micro1 超详细深度解析:架构原理、部署实战、性能评测与落地应用全指南
人工智能·架构
冰西瓜6001 小时前
深度学习的数学原理(三十三)—— Transformer编码器完整实现
人工智能·深度学习·transformer
科研前沿1 小时前
镜像孪生VS视频孪生核心技术产品核心优势
大数据·人工智能·算法·重构·空间计算