【数据集】红外建筑生活垃圾目标检测数据集VOC+YOLO格式1341张8类别

数据集是计算机视觉技术研发的核心支撑资源,贯穿算法训练、性能验证与效果评估全流程,兼具全面性、适配性与权威性。它囊括图像分类、目标检测、实例分割、语义分割

等多类任务导向的样本集,覆盖自然场景、工业制造、医疗影像、遥感监测等多元应用领域。优质数据集具备样本规模庞大、标注精度严苛、训练验证测试子集划分科学的特点,既是驱动深度学习算法创新迭代的关键基石,也为人工智能产品落地与前沿学术研究提供坚实保障。

红外裂缝目标检测数据集

数据集背景

在红外建筑生活垃圾目标检测数据集研发与应用场景中,该数据集标注精准、格式兼容性强、样本覆盖全面,贴合红外无人机建筑垃圾分类巡检、城市环卫夜间排查、工地建筑垃圾清运监管、社区生活垃圾夜间整治的实际技术需求,背景意义突出且应用价值明确:红外成像技术不受光照条件限制、可穿透轻微粉尘与薄雾、抗环境光干扰,弥补了可见光成像在夜间、逆光、清晨薄雾、工地粉尘等场景下建筑生活垃圾辨识度低、易被建筑废料、植被杂物、光影变化干扰的监测短板,而本数据集聚焦建筑生活垃圾核心目标,精准覆盖brick(砖块)、concrete(混凝土)、metal(金属)、mixture(混合物)、paper-and-cardboard(纸和纸板)、plastic(塑料)、tiles-and-ceramic(瓷砖和陶瓷)、wood(木材)8类关键垃圾对象,针对性解决红外建筑生活垃圾场景下垃圾特征模糊、背景杂波(建筑废料、泥土、植被)干扰强、细小垃圾易遗漏、垃圾类别判定难的行业痛点,为红外建筑生活垃圾检测算法的研发、迭代与落地提供核心标准化数据支撑。红外建筑生活垃圾监测场景中,该数据集为垃圾目标检测模型训练提供标准化样本支撑,依托VOC+YOLO的通用适配格式,可快速适配YOLO系列、Faster R-CNN、U-Net等各类主流检测与分割算法,解决红外成像下垃圾与建筑背景、地面环境灰度对比度低、垃圾轮廓特征不明显、细小垃圾(纸和纸板、塑料碎片)难识别、夜间/逆光环境下垃圾边界模糊、同类垃圾(不同材质砖块、塑料)易混淆的样本匮乏问题,检测重点聚焦红外场景下8类建筑生活垃圾的精准定位、垃圾轮廓提取、垃圾类别判定,以及垃圾堆积面积、堆积密度的量化识别,有效应对夜间微光、轻微粉尘遮挡、远距离垃圾、建筑施工场景复杂背景、垃圾局部遮挡(被泥土、杂草覆盖)等核心检测难题,助力建筑施工监管、城市环卫巡检、社区垃圾整治、建筑垃圾资源化回收等场景实现全时段自动化监测,替代人工完成建筑生活垃圾排查、垃圾分类识别、垃圾堆积预警、清运监管辅助等工作,大幅提升垃圾监测效率与垃圾分类识别准确率,降低人工巡检成本与环境治理管控风险。

数据集信息

数据集规模

jpg/jpeg/png文件总个数

"图片总数量":1341

json/txt/xml文件总个数

"标注总数量":1341

类别名称总数量

"标签总数量":8

数据集划分

数据划分

"总数量 1341"

"训练集 939"

"验证集 268"

"测试集 134"

标注类别名称

'brick'

'concrete'

'metal'

'mixture'

'paper-and-cardboard'

'plastic'

'tiles-and-ceramic'

'wood'

数据集格式

图片预览

标注示例

数据集格式

YOLO 格式

yolo_dataset/

├── images/ # 存放所有图片文件

│ ├── train/ # 训练集图片

│ │ ├── 000001.jpg

│ │ ├── 000002.jpg

│ │ └── ...

│ ├── val/ # 验证集图片

│ │ ├── 000001.jpg

│ │ ├── 000002.jpg

│ │ └── ...

│ └── test/ # 测试集图片

│ ├── 000001.jpg

│ ├── 000002.jpg

│ └── ...

├── labels/ # 存放所有TXT标注文件

│ ├── train/ # 训练集标注

│ │ ├── 000001.txt

│ │ ├── 000002.txt

│ │ └── ...

│ ├── val/ # 验证集标注

│ │ ├── 000001.txt

│ │ ├── 000002.txt

│ │ └── ...

│ └── test/ # 测试集标注

│ ├── 000001.txt

│ ├── 000002.txt

│ └── ...

├── data.yaml # YOLO配置文件

└── classes.txt # 类别名称文件(可选)

"目录说明"

  1. images/
  • 存放所有JPG/JPEG/PNG格式的图片文件
  • 按数据集划分分为train、val、test三个子目录
  • 图片文件名建议采用6位数字编号(如000001.jpg)
  1. labels/
  • 存放所有TXT标注文件,每个TXT文件对应一张图片
  • TXT文件命名与图片文件完全一致(仅扩展名不同)
  • 按数据集划分分为train、val、test三个子目录
  • 每个TXT文件包含以下信息:
    • 每行表示一个目标的标注信息
    • 格式为:class_id x_center y_center width height
    • 所有坐标和尺寸均已归一化(取值范围0-1)
  1. data.yaml
  • YOLO模型训练的配置文件
  • 包含数据集路径、类别数、类别名称等信息
  1. classes.txt(可选)
  • 存放类别名称列表,每行一个类别
  • 与data.yaml中的类别名称保持一致

"示例文件内容"

TXT标注文件示例(000001.txt)

0 0.2 0.3 0.15 0.2

  • 0:类别索引(对应data.yaml中的第一个类别)
  • 0.2:目标框中心点横坐标(归一化后)
  • 0.3:目标框中心点纵坐标(归一化后)
  • 0.15:目标框宽度(归一化后)
  • 0.2:目标框高度(归一化后)

"data.yaml配置文件示例"

path: YOLO

train: images/train

val: images/val

test: images/test

nc: 1

names: 'class1'

"classes.txt文件示例"

class1

Pascal VOC 格式

VOC/

├── Annotations/ # 存放所有XML标注文件

│ ├── 000001.xml

│ ├── 000002.xml

│ └── ...

├── ImageSets/ # 存放数据集划分文件

│ └── Main/

│ ├── train.txt # 训练集图片列表

│ ├── val.txt # 验证集图片列表

│ ├── test.txt # 测试集图片列表

│ └── trainval.txt # 训练+验证集图片列表

├── JPEGImages/ # 存放所有JPG图片文件

│ ├── 000001.jpg

│ ├── 000002.jpg

│ └── ...

├── SegmentationClass/ # 可选:存放语义分割标注(如果有)

│ └── ...

└── SegmentationObject/ # 可选:存放实例分割标注(如果有)

└── ...

"目录说明"

"1.Annotations/"

  • 存放所有XML标注文件,每个XML文件对应一张图片
  • XML文件命名与图片文件完全一致(仅扩展名不同)
  • 每个XML文件包含以下信息:
    • 图片基本信息(文件名、尺寸、通道数)
    • 目标标注信息(类别名称、边界框坐标、姿态、遮挡状态等)
      "2.ImageSets/Main/"
  • 存放数据集划分文件,每个文件包含对应集合的图片文件名(不含扩展名)
  • 常见划分文件:
    • train.txt:训练集图片列表
    • val.txt:验证集图片列表
    • test.txt:测试集图片列表
    • trainval.txt:训练+验证集图片列表
      "3.JPEGImages/"
  • 存放所有JPG/JPEG/PNG格式的图片文件
  • 图片文件名建议采用6位数字编号(如000001.jpg)
    数据集标注工具
    离线标注工具Labelme
    conda create -n labelme python=3.9
    conda activate labelme
    pip install pyqt
    pip install pillow
    pip install labelme
    labelme

在线标注工具MakeSense

在线地址

http://makesense.ai/

注意事项

在这里要再次特别声明:本数据集不对训练的模型或者权重文件精度作任何保证。由于数据本身的局限性、标注的误差以及模型训练过程中的各种不确定因素,最终训练出的模型精度可能会有所差异。使用者在使用这个数据集进行模型训练时,需要充分考虑到这些因素,自行评估模型的性能和可靠性,不要过分依赖数据集来保证模型的高精度。同时,在使用过程中,如果发现数据存在问题或者有任何疑问,欢迎随时与我们交流反馈。

相关推荐
Ricky05531 天前
YOLO-FCE:一种基于特征与聚类增强的物种分类目标检测模型(澳大利亚2026年研究)
图像处理·人工智能·yolo·目标检测·分类
jingjingjing11111 天前
随笔:为何无人机的机体系向惯性系的旋转矩阵就是无人机的姿态在惯性系中的表示
无人机·无人机坐标系
不懒不懒1 天前
基于 YOLOv10 的汽车机油滤芯缺陷检测系统(训练 + 测试 + 可视化 + 避坑)
yolo·汽车
AI浩1 天前
【全面解析】 模型批量训练与基线测试:实验设计篇
目标检测·计算机视觉
视觉算法小姥1 天前
yolov11-obb在rk芯片部署的onnx模型输出的剪枝处理
算法·yolo·剪枝
Multipath7121 天前
与辉同行山东行看大型户外活动的通信保障
网络·5g·安全·无人机·实时音视频
视觉算法小姥1 天前
YOLOV11-OBB之ONNX转RKNN并跑在模拟器上
yolo
Ricky05531 天前
YOLO26:实时目标检测的关键架构改进与性能基准测试(2025年10月美国研究)
人工智能·目标检测·目标跟踪
牧鸯人1 天前
基于yolov8的课堂行为检测系统——主要功能检测睡觉、手机、人数
python·深度学习·yolo·学生行为统计
feibaoqq1 天前
无人机通信链路软杀伤干扰技术与工程实测标准
无人机·低空安防