【目标跟踪】AntiUAV410数据集详细介绍

上一篇博客介绍了Anti-UAV数据集(【目标跟踪】Anti-UAV数据集详细介绍-CSDN博客),本篇将介绍Anti-UAV410,实际是在Anti-UAV数据集还存在的小问题进行了数据改进(不是对源数据直接修改,是新的数据集补齐了Anti-UAV的短板)。

还有一点要提前说明,Anti-UAV数据集是双模态的数据集 (RGB和TIR的视频对),Anti-UAV410是单模态的数据集(TIR视频)。

论文链接:Anti-UAV410: A Thermal Infrared Benchmark and Customized Scheme for Tracking Drones in the Wild | IEEE Journals & Magazine | IEEE Xplorehttps://ieeexplore.ieee.org/document/10325629代码链接:HwangBo94/Anti-UAV410: The benchmark of AntiUAV410.https://github.com/HwangBo94/Anti-UAV410/tree/main

1、Introduction概述

传统的热红外图像跟踪一般都是关注大尺寸的目标,并不适用与小目标跟踪(例如无人机)。虽然已经引入了Anti-UAV数据集来解决无人机跟踪的问题,但是还存在不能反映真实场景的局限。(也就是说,Anti-UAV410数据集的提出团队认为已有的Anti-UAV数据集没有很好的还原真实的无人机飞行场景

因此,提出了Anti-UAV410数据集,该数据集包含了410条序列(这也是数据集名字的由来),共有超过438k个边界框(标注的非常仔细了)。下图是从Anti-UAV410数据集中截取的不同场景的图片 (a):lakes (b):buildings (c):forests (d):hills

2、Data Collection数据收集

Anti-UAV410数据集为了创造更为真实的环境,作者团队在各种各样的复杂环境进行视频捕获。这些场景包括白天和夜晚(光线不同)、秋天和冬天(季节不同),以及多种背景(建筑30%,山脉20%,森林5%,都市30%,云层10%,水面3%等)。能看出来背景的多样性的确要比Anti-UAV更好一些。

视频序列帧率为25FPS (跟Anti-UAV是一样的),在获取的视频序列中,作者团队选取了100minutes的视频进行了细致的逐帧标注,共计超过15万帧。同时,为了扩大数据规模,作者团队融合了Anti-UAV数据集和第一届Anti-UAV Challenge website的视频(对这里的视频都进行了裁剪和清洗,确保一致性和质量)。

由于Anti-UAV是双模态数据集,其中一些视频片段不适合用于individual TIR tracking(有些TIR video在第一帧是没有跟踪目标的,而visible video中有),因此作者团队抛弃了这部分的视频序列。

3、 Annotation标注

Anti-UAV410数据集的标注方法跟Anti-UAV是一样的,三阶段标注(不知道的同学移步【目标跟踪】Anti-UAV数据集详细介绍-CSDN博客),不同点在于:Anti-UAV数据集的真实框是以角点的形式给出的[x1,y1,x2, y2] ,Anti-UAV410数据集的真实框是以[x1, y1, w, h] 的形式给出的(x1, y1是边界框的左上角坐标),在没有跟踪目标的帧中真实框被设为0。

4、Statistics统计

Dataset Splitting

Anti-UAV410数据集中的训练集和验证集来自同一个视频的非重叠部分 ,而测试集则完全独立 于训练集和验证集。其中,训练集包含200个视频对,验证集包含90个视频对,测试集包含 1220个视频对。

三个子集在每个挑战属性上比例相对均匀,此时使用训练集可以更好地学习到无人机跟踪在野外场景下所面临的挑战。

Scale distribution

作者团队为了还原真实的无人机使用场景,专门提升了小尺寸目标在数据集中的比例。Anti-UAV410数据集中的帧大小为640×512。论文中还分析了其他数据集与Anti-UAV410数据集中目标尺寸。如下表所示。

Anti-UAV410数据集中的tiny目标尺寸只有10pixels,从上表中能很明显看出来Anti-UAV410数据集中tiny目标的数据量要远大于其他数据集。

Attribute Definition

Anti-UAV410数据集的属性设置和Anti-UAV数据集差不多新增了DBC的属性,也是在论文的introduction部分就专门提到的。从下表中能明显看出TC属性的视频序列数量是最多的,因为在实际场景中,热交叉在TIR视频中是非常容易遇到的。

5、Compared With Anti-UAV Dataset

这一部分内容博主就直接截屏原论文了(因为在前面的部分差不多都零零散散的提到了)。

相关推荐
weex_2133442 分钟前
WEEXNews「昨夜今晨重要资讯,11月27日
人工智能
ericliu20171 小时前
EfficientQAT: 大型语言模型的高效量化感知训练
人工智能·语言模型·自然语言处理
Yanbin_Q1 小时前
用 llama.cpp 体验 Meta 的 Llama AI 模型
人工智能·llama
老艾的AI世界2 小时前
AI让照片跳舞,人人都能是舞王!Swan下载介绍
人工智能·深度学习·神经网络·目标检测·机器学习·ai·图像识别·ai生成视频·ai跳舞·ai视频生成
Dipeak数巅科技2 小时前
通过数巅能源大模型降本增效
大数据·数据库·人工智能·数据分析·能源
电子工程师UP学堂2 小时前
电子应用设计方案-30:智能扫地机器人系统方案设计
网络·人工智能·单片机·嵌入式硬件·机器人
山川而川-R2 小时前
yolov8的深度学习环境安装(cuda12.4、ubuntu22.04)
人工智能·深度学习·yolov8
whaosoft-1432 小时前
51c自动驾驶~合集38
人工智能
白书宇3 小时前
23.100ASK_T113-PRO 移植opencv
人工智能·嵌入式硬件·opencv·物联网·计算机视觉·硬件工程