数据集是计算机视觉技术研发的核心支撑资源,贯穿算法训练、性能验证与效果评估全流程,兼具全面性、适配性与权威性。它囊括图像分类、目标检测、实例分割、语义分割
等多类任务导向的样本集,覆盖自然场景、工业制造、医疗影像、遥感监测等多元应用领域。优质数据集具备样本规模庞大、标注精度严苛、训练验证测试子集划分科学的特点,既是驱动深度学习算法创新迭代的关键基石,也为人工智能产品落地与前沿学术研究提供坚实保障。
红外无人机交通车辆目标检测数据集
数据集背景
在红外无人机交通车辆目标检测数据集研发与应用场景中,该数据集标注精准、格式兼容性强、样本覆盖全面,贴合红外无人机低空交通巡航、全天候路况监测、复杂道路环境适配的实际技术需求,背景意义突出且应用价值明确:红外成像技术不受光照条件限制、可穿雾透霾抗干扰,弥补了可见光成像在夜间、恶劣天气下的监测短板,而本数据集聚焦道路场景核心目标,精准覆盖Car、Motorbike、Person、Truck四类关键检测对象,针对性解决红外交通场景下目标特征单一、背景干扰复杂、弱小目标易遗漏、动态目标追踪难的行业痛点,为红外无人机交通车辆检测算法的研发、迭代与落地提供核心标准化数据支撑。红外无人机道路交通巡检场景中,该数据集为低空交通车辆检测模型训练提供标准化样本支撑,依托VOC+YOLO的通用适配格式,可快速适配YOLO系列、Faster R-CNN等各类主流检测算法,解决红外成像下车辆与行人目标缺乏颜色纹理、道路背景杂波干扰强、夜间目标与路面对比度低、特征提取难度大的样本匮乏问题,检测重点聚焦红外场景下Car、Motorbike、Truck的精准定位、车身轮廓识别、行驶轨迹预判,以及道路周边Person目标的精准捕捉与区分,有效应对夜间微光、道路扬尘、远距离弱小车辆、遮挡车辆、动态行人等核心检测难题,助力道路交通巡检实现全时段自动化巡航,替代人工完成路况排查、车辆流量统计、违规占道监测等工作,大幅提升交通巡检效率与覆盖范围。
数据集信息
数据集规模
jpg/jpeg/png文件总个数
"图片总数量":2371
json/txt/xml文件总个数
"标注总数量":2371
类别名称总数量
"标签总数量":4
数据集划分
数据划分
"总数量 2371"
"训练集 1660"
"验证集 474"
"测试集 237"
标注类别名称
'Car'
'Motorbike'
'Person'
'Truck'
数据集格式
图片预览
标注示例
数据集格式
YOLO 格式
yolo_dataset/
├── images/ # 存放所有图片文件
│ ├── train/ # 训练集图片
│ │ ├── 000001.jpg
│ │ ├── 000002.jpg
│ │ └── ...
│ ├── val/ # 验证集图片
│ │ ├── 000001.jpg
│ │ ├── 000002.jpg
│ │ └── ...
│ └── test/ # 测试集图片
│ ├── 000001.jpg
│ ├── 000002.jpg
│ └── ...
├── labels/ # 存放所有TXT标注文件
│ ├── train/ # 训练集标注
│ │ ├── 000001.txt
│ │ ├── 000002.txt
│ │ └── ...
│ ├── val/ # 验证集标注
│ │ ├── 000001.txt
│ │ ├── 000002.txt
│ │ └── ...
│ └── test/ # 测试集标注
│ ├── 000001.txt
│ ├── 000002.txt
│ └── ...
├── data.yaml # YOLO配置文件
└── classes.txt # 类别名称文件(可选)
"目录说明"
- images/
- 存放所有JPG/JPEG/PNG格式的图片文件
- 按数据集划分分为train、val、test三个子目录
- 图片文件名建议采用6位数字编号(如000001.jpg)
- labels/
- 存放所有TXT标注文件,每个TXT文件对应一张图片
- TXT文件命名与图片文件完全一致(仅扩展名不同)
- 按数据集划分分为train、val、test三个子目录
- 每个TXT文件包含以下信息:
- 每行表示一个目标的标注信息
- 格式为:class_id x_center y_center width height
- 所有坐标和尺寸均已归一化(取值范围0-1)
- data.yaml
- YOLO模型训练的配置文件
- 包含数据集路径、类别数、类别名称等信息
- classes.txt(可选)
- 存放类别名称列表,每行一个类别
- 与data.yaml中的类别名称保持一致
"示例文件内容"
TXT标注文件示例(000001.txt)
0 0.2 0.3 0.15 0.2
- 0:类别索引(对应data.yaml中的第一个类别)
- 0.2:目标框中心点横坐标(归一化后)
- 0.3:目标框中心点纵坐标(归一化后)
- 0.15:目标框宽度(归一化后)
- 0.2:目标框高度(归一化后)
"data.yaml配置文件示例"
path: YOLO
train: images/train
val: images/val
test: images/test
nc: 1
names: ['class1']
"classes.txt文件示例"
class1
Pascal VOC 格式
VOC/
├── Annotations/ # 存放所有XML标注文件
│ ├── 000001.xml
│ ├── 000002.xml
│ └── ...
├── ImageSets/ # 存放数据集划分文件
│ └── Main/
│ ├── train.txt # 训练集图片列表
│ ├── val.txt # 验证集图片列表
│ ├── test.txt # 测试集图片列表
│ └── trainval.txt # 训练+验证集图片列表
├── JPEGImages/ # 存放所有JPG图片文件
│ ├── 000001.jpg
│ ├── 000002.jpg
│ └── ...
├── SegmentationClass/ # 可选:存放语义分割标注(如果有)
│ └── ...
└── SegmentationObject/ # 可选:存放实例分割标注(如果有)
└── ...
"目录说明"
"1.Annotations/"
- 存放所有XML标注文件,每个XML文件对应一张图片
- XML文件命名与图片文件完全一致(仅扩展名不同)
- 每个XML文件包含以下信息:
- 图片基本信息(文件名、尺寸、通道数)
- 目标标注信息(类别名称、边界框坐标、姿态、遮挡状态等)
"2.ImageSets/Main/"
- 存放数据集划分文件,每个文件包含对应集合的图片文件名(不含扩展名)
- 常见划分文件:
- train.txt:训练集图片列表
- val.txt:验证集图片列表
- test.txt:测试集图片列表
- trainval.txt:训练+验证集图片列表
"3.JPEGImages/"
- 存放所有JPG/JPEG/PNG格式的图片文件
- 图片文件名建议采用6位数字编号(如000001.jpg)
数据集标注工具
离线标注工具Labelme
conda create -n labelme python=3.9
conda activate labelme
pip install pyqt
pip install pillow
pip install labelme
labelme
在线标注工具MakeSense
在线地址
注意事项
在这里要再次特别声明:本数据集不对训练的模型或者权重文件精度作任何保证。由于数据本身的局限性、标注的误差以及模型训练过程中的各种不确定因素,最终训练出的模型精度可能会有所差异。使用者在使用这个数据集进行模型训练时,需要充分考虑到这些因素,自行评估模型的性能和可靠性,不要过分依赖数据集来保证模型的高精度。同时,在使用过程中,如果发现数据存在问题或者有任何疑问,欢迎随时与我们交流反馈。