【目标跟踪】AntiUAV410数据集详细介绍

上一篇博客介绍了Anti-UAV数据集(【目标跟踪】Anti-UAV数据集详细介绍-CSDN博客),本篇将介绍Anti-UAV410,实际是在Anti-UAV数据集还存在的小问题进行了数据改进(不是对源数据直接修改,是新的数据集补齐了Anti-UAV的短板)。

还有一点要提前说明,Anti-UAV数据集是双模态的数据集 (RGB和TIR的视频对),Anti-UAV410是单模态的数据集(TIR视频)。

论文链接:Anti-UAV410: A Thermal Infrared Benchmark and Customized Scheme for Tracking Drones in the Wild | IEEE Journals & Magazine | IEEE Xplorehttps://ieeexplore.ieee.org/document/10325629代码链接:HwangBo94/Anti-UAV410: The benchmark of AntiUAV410.https://github.com/HwangBo94/Anti-UAV410/tree/main

1、Introduction概述

传统的热红外图像跟踪一般都是关注大尺寸的目标,并不适用与小目标跟踪(例如无人机)。虽然已经引入了Anti-UAV数据集来解决无人机跟踪的问题,但是还存在不能反映真实场景的局限。(也就是说,Anti-UAV410数据集的提出团队认为已有的Anti-UAV数据集没有很好的还原真实的无人机飞行场景

因此,提出了Anti-UAV410数据集,该数据集包含了410条序列(这也是数据集名字的由来),共有超过438k个边界框(标注的非常仔细了)。下图是从Anti-UAV410数据集中截取的不同场景的图片 (a):lakes (b):buildings (c):forests (d):hills

2、Data Collection数据收集

Anti-UAV410数据集为了创造更为真实的环境,作者团队在各种各样的复杂环境进行视频捕获。这些场景包括白天和夜晚(光线不同)、秋天和冬天(季节不同),以及多种背景(建筑30%,山脉20%,森林5%,都市30%,云层10%,水面3%等)。能看出来背景的多样性的确要比Anti-UAV更好一些。

视频序列帧率为25FPS (跟Anti-UAV是一样的),在获取的视频序列中,作者团队选取了100minutes的视频进行了细致的逐帧标注,共计超过15万帧。同时,为了扩大数据规模,作者团队融合了Anti-UAV数据集和第一届Anti-UAV Challenge website的视频(对这里的视频都进行了裁剪和清洗,确保一致性和质量)。

由于Anti-UAV是双模态数据集,其中一些视频片段不适合用于individual TIR tracking(有些TIR video在第一帧是没有跟踪目标的,而visible video中有),因此作者团队抛弃了这部分的视频序列。

3、 Annotation标注

Anti-UAV410数据集的标注方法跟Anti-UAV是一样的,三阶段标注(不知道的同学移步【目标跟踪】Anti-UAV数据集详细介绍-CSDN博客),不同点在于:Anti-UAV数据集的真实框是以角点的形式给出的[x1,y1,x2, y2] ,Anti-UAV410数据集的真实框是以[x1, y1, w, h] 的形式给出的(x1, y1是边界框的左上角坐标),在没有跟踪目标的帧中真实框被设为0。

4、Statistics统计

Dataset Splitting

Anti-UAV410数据集中的训练集和验证集来自同一个视频的非重叠部分 ,而测试集则完全独立 于训练集和验证集。其中,训练集包含200个视频对,验证集包含90个视频对,测试集包含 1220个视频对。

三个子集在每个挑战属性上比例相对均匀,此时使用训练集可以更好地学习到无人机跟踪在野外场景下所面临的挑战。

Scale distribution

作者团队为了还原真实的无人机使用场景,专门提升了小尺寸目标在数据集中的比例。Anti-UAV410数据集中的帧大小为640×512。论文中还分析了其他数据集与Anti-UAV410数据集中目标尺寸。如下表所示。

Anti-UAV410数据集中的tiny目标尺寸只有10pixels,从上表中能很明显看出来Anti-UAV410数据集中tiny目标的数据量要远大于其他数据集。

Attribute Definition

Anti-UAV410数据集的属性设置和Anti-UAV数据集差不多新增了DBC的属性,也是在论文的introduction部分就专门提到的。从下表中能明显看出TC属性的视频序列数量是最多的,因为在实际场景中,热交叉在TIR视频中是非常容易遇到的。

5、Compared With Anti-UAV Dataset

这一部分内容博主就直接截屏原论文了(因为在前面的部分差不多都零零散散的提到了)。

相关推荐
ACP广源盛139246256731 小时前
(ACP广源盛)GSV1175---- MIPI/LVDS 转 Type-C/DisplayPort 1.2 转换器产品说明及功能分享
人工智能·音视频
胡耀超1 小时前
隐私计算技术全景:从联邦学习到可信执行环境的实战指南—数据安全——隐私计算 联邦学习 多方安全计算 可信执行环境 差分隐私
人工智能·安全·数据安全·tee·联邦学习·差分隐私·隐私计算
停停的茶3 小时前
深度学习(目标检测)
人工智能·深度学习·目标检测
Y200309163 小时前
基于 CIFAR10 数据集的卷积神经网络(CNN)模型训练与集成学习
人工智能·cnn·集成学习
老兵发新帖3 小时前
主流神经网络快速应用指南
人工智能·深度学习·神经网络
AI量化投资实验室4 小时前
15年122倍,年化43.58%,回撤才20%,Optuna机器学习多目标调参backtrader,附python代码
人工智能·python·机器学习
java_logo4 小时前
vllm-openai Docker 部署手册
运维·人工智能·docker·ai·容器
倔强青铜三4 小时前
苦练Python第67天:光速读取任意行,linecache模块解锁文件处理新姿势
人工智能·python·面试
算家计算4 小时前
重磅突破!全球首个真实物理环境机器人基准测试正式发布,具身智能迎来 “ImageNet 时刻”
人工智能·资讯
新智元4 小时前
苹果 M5「夜袭」高通英特尔!AI 算力狂飙 400%,Pro 三剑客火速上新
人工智能·openai