【目标跟踪】AntiUAV410数据集详细介绍

上一篇博客介绍了Anti-UAV数据集(【目标跟踪】Anti-UAV数据集详细介绍-CSDN博客),本篇将介绍Anti-UAV410,实际是在Anti-UAV数据集还存在的小问题进行了数据改进(不是对源数据直接修改,是新的数据集补齐了Anti-UAV的短板)。

还有一点要提前说明,Anti-UAV数据集是双模态的数据集 (RGB和TIR的视频对),Anti-UAV410是单模态的数据集(TIR视频)。

论文链接:Anti-UAV410: A Thermal Infrared Benchmark and Customized Scheme for Tracking Drones in the Wild | IEEE Journals & Magazine | IEEE Xplorehttps://ieeexplore.ieee.org/document/10325629代码链接:HwangBo94/Anti-UAV410: The benchmark of AntiUAV410.https://github.com/HwangBo94/Anti-UAV410/tree/main

1、Introduction概述

传统的热红外图像跟踪一般都是关注大尺寸的目标,并不适用与小目标跟踪(例如无人机)。虽然已经引入了Anti-UAV数据集来解决无人机跟踪的问题,但是还存在不能反映真实场景的局限。(也就是说,Anti-UAV410数据集的提出团队认为已有的Anti-UAV数据集没有很好的还原真实的无人机飞行场景

因此,提出了Anti-UAV410数据集,该数据集包含了410条序列(这也是数据集名字的由来),共有超过438k个边界框(标注的非常仔细了)。下图是从Anti-UAV410数据集中截取的不同场景的图片 (a):lakes (b):buildings (c):forests (d):hills

2、Data Collection数据收集

Anti-UAV410数据集为了创造更为真实的环境,作者团队在各种各样的复杂环境进行视频捕获。这些场景包括白天和夜晚(光线不同)、秋天和冬天(季节不同),以及多种背景(建筑30%,山脉20%,森林5%,都市30%,云层10%,水面3%等)。能看出来背景的多样性的确要比Anti-UAV更好一些。

视频序列帧率为25FPS (跟Anti-UAV是一样的),在获取的视频序列中,作者团队选取了100minutes的视频进行了细致的逐帧标注,共计超过15万帧。同时,为了扩大数据规模,作者团队融合了Anti-UAV数据集和第一届Anti-UAV Challenge website的视频(对这里的视频都进行了裁剪和清洗,确保一致性和质量)。

由于Anti-UAV是双模态数据集,其中一些视频片段不适合用于individual TIR tracking(有些TIR video在第一帧是没有跟踪目标的,而visible video中有),因此作者团队抛弃了这部分的视频序列。

3、 Annotation标注

Anti-UAV410数据集的标注方法跟Anti-UAV是一样的,三阶段标注(不知道的同学移步【目标跟踪】Anti-UAV数据集详细介绍-CSDN博客),不同点在于:Anti-UAV数据集的真实框是以角点的形式给出的[x1,y1,x2, y2] ,Anti-UAV410数据集的真实框是以[x1, y1, w, h] 的形式给出的(x1, y1是边界框的左上角坐标),在没有跟踪目标的帧中真实框被设为0。

4、Statistics统计

Dataset Splitting

Anti-UAV410数据集中的训练集和验证集来自同一个视频的非重叠部分 ,而测试集则完全独立 于训练集和验证集。其中,训练集包含200个视频对,验证集包含90个视频对,测试集包含 1220个视频对。

三个子集在每个挑战属性上比例相对均匀,此时使用训练集可以更好地学习到无人机跟踪在野外场景下所面临的挑战。

Scale distribution

作者团队为了还原真实的无人机使用场景,专门提升了小尺寸目标在数据集中的比例。Anti-UAV410数据集中的帧大小为640×512。论文中还分析了其他数据集与Anti-UAV410数据集中目标尺寸。如下表所示。

Anti-UAV410数据集中的tiny目标尺寸只有10pixels,从上表中能很明显看出来Anti-UAV410数据集中tiny目标的数据量要远大于其他数据集。

Attribute Definition

Anti-UAV410数据集的属性设置和Anti-UAV数据集差不多新增了DBC的属性,也是在论文的introduction部分就专门提到的。从下表中能明显看出TC属性的视频序列数量是最多的,因为在实际场景中,热交叉在TIR视频中是非常容易遇到的。

5、Compared With Anti-UAV Dataset

这一部分内容博主就直接截屏原论文了(因为在前面的部分差不多都零零散散的提到了)。

相关推荐
java_heartLake1 小时前
基于deepseek的AI知识库系统搭建
人工智能·deepseek
阿里云云原生2 小时前
山石网科×阿里云通义灵码,开启研发“AI智造”新时代
网络·人工智能·阿里云·ai程序员·ai程序员体验官
diemeng11193 小时前
AI前端开发技能变革时代:效率与创新的新范式
前端·人工智能
有Li3 小时前
跨中心模型自适应牙齿分割|文献速递-医学影像人工智能进展
人工智能
牧歌悠悠7 小时前
【深度学习】Unet的基础介绍
人工智能·深度学习·u-net
坚毅不拔的柠檬柠檬8 小时前
AI革命下的多元生态:DeepSeek、ChatGPT、XAI、文心一言与通义千问的行业渗透与场景重构
人工智能·chatgpt·文心一言
坚毅不拔的柠檬柠檬8 小时前
2025:人工智能重构人类文明的新纪元
人工智能·重构
jixunwulian8 小时前
DeepSeek赋能AI边缘计算网关,开启智能新时代!
人工智能·边缘计算
Archie_IT8 小时前
DeepSeek R1/V3满血版——在线体验与API调用
人工智能·深度学习·ai·自然语言处理
大数据追光猿8 小时前
Python应用算法之贪心算法理解和实践
大数据·开发语言·人工智能·python·深度学习·算法·贪心算法