多模态目标检测-LLVIP数据集处理(清洗+YOLO格式)

0、介绍

2021 年,北京邮电大学的研究团队发布了LLVIP 数据集,首次为低光照下的可见光-红外多模态任务提供了大规模、高精度的统一基准。

基本信息:

为什么需要 LLVIP?

  • TNO 数据集:仅 261 对图像,样本量太小,完全不适合深度学习
  • KAIST/FLIR 数据集:面向自动驾驶,驾驶视角且夜间图像亮度仍较高
  • OSU 数据集:全部采集于白天,红外图像完全没有优势
  • CVC-14 数据集:图像时间不对齐,无法用于图像融合任务

与主流数据集对比:

数据集 样本量 是否对齐 场景 视角 低光照程度 行人标注
TNO 261 对 军事 地面 中等
KAIST 4750 对 交通 驾驶
FLIR 5258 对 × 交通 驾驶
CVC-14 849 对 × 交通 驾驶
LLVIP 16836 对 街道 监控 极暗

优势:

  • 时空严格对齐:采用双目相机同步采集,经过半手动配准,像素级对齐,完美支持图像融合和有监督图像翻译
  • 纯低光照场景:绝大多数图像拍摄于无路灯或极弱光照的环境,红外图像的互补作用极其明显
  • 高精度行人标注:首创 "红外标注反向映射" 方法,解决了低光照可见光图像标注难的问题
  • 大规模高质量:1.6 万对样本是当时同领域最大的数据集,且图像质量远高于其他数据集

图例:


为了用yolo模型对数据集进行测试,需转换格式并划分数据集

1、下载数据集

下载得到压缩文件,解压后得到以下文件夹

annotations是voc标签

infrared是红外光图像

visible是可见光图像

2、转换数据集格式(VOC2YOLO)

参考:目标检测-数据处理,YOLO2JSON、VOC2YOLO、YOLO2VOC、JSON2YOLO-CSDN博客

注意:此处有个坑,原始的train图像文件夹下的

100030.jpg

100033.jpg

这两个图像没有目标,所以可以把它们删除,不然数据集和标签数量不对等

3、划分数据集

按照train:val:test=7:1:2划分,但由于test已经划分好了,3463/15488=0.2236,只能让val的比例尽可能为0.1,差不多就是1804张,则train就是10218张

划分数据集参考:

目标检测-数据划分(YOLO格式)_yolo数据集划分代码-CSDN博客

最终划分结果为:

|-------|-------|
| train | 10218 |
| val | 1805 |
| test | 3463 |

4、可视化验证

相关推荐
qq3621967051 小时前
APK版本选择完全指南——beta/stable/arm64/x86/bundle/universal怎么选?
网络·人工智能
哈伦20191 小时前
第十二章 深度学习基础 案例:CNN分析K线图来评估股票价格趋势
深度学习·cnn·k线图
大树881 小时前
一滴冷却液,烧掉2000万算力
大数据·运维·服务器·人工智能
醒醒该学习了!2 小时前
人工智能的核心算法基础(理论篇)
人工智能
一切皆是因缘际会2 小时前
量化阈值拆解|2026端侧AI复盘
人工智能·架构·系统架构
圣殿骑士-Khtangc2 小时前
LLM 推理加速全攻略:vLLM、TensorRT-LLM 与量化技术实战
人工智能
meilindehuzi_a2 小时前
全栈进阶:告别 Node 繁琐配置,用下一代运行时 Bun 丝滑构建 AI Agent 客户端
人工智能·llm
龙腾AI白云2 小时前
用知识图谱重构搜索引擎
人工智能·virtualenv·scikit-learn
AI服务老曹2 小时前
解耦异构算力与多协议混战:基于 Docker 容器化的国标 GB28181/RTSP 边缘计算 AI 视频管理平台架构设计与源码交付实践
人工智能·docker·边缘计算