【目标跟踪】AntiUAV410数据集详细介绍

上一篇博客介绍了Anti-UAV数据集(【目标跟踪】Anti-UAV数据集详细介绍-CSDN博客),本篇将介绍Anti-UAV410,实际是在Anti-UAV数据集还存在的小问题进行了数据改进(不是对源数据直接修改,是新的数据集补齐了Anti-UAV的短板)。

还有一点要提前说明,Anti-UAV数据集是双模态的数据集 (RGB和TIR的视频对),Anti-UAV410是单模态的数据集(TIR视频)。

论文链接:Anti-UAV410: A Thermal Infrared Benchmark and Customized Scheme for Tracking Drones in the Wild | IEEE Journals & Magazine | IEEE Xplorehttps://ieeexplore.ieee.org/document/10325629代码链接:HwangBo94/Anti-UAV410: The benchmark of AntiUAV410.https://github.com/HwangBo94/Anti-UAV410/tree/main

1、Introduction概述

传统的热红外图像跟踪一般都是关注大尺寸的目标,并不适用与小目标跟踪(例如无人机)。虽然已经引入了Anti-UAV数据集来解决无人机跟踪的问题,但是还存在不能反映真实场景的局限。(也就是说,Anti-UAV410数据集的提出团队认为已有的Anti-UAV数据集没有很好的还原真实的无人机飞行场景

因此,提出了Anti-UAV410数据集,该数据集包含了410条序列(这也是数据集名字的由来),共有超过438k个边界框(标注的非常仔细了)。下图是从Anti-UAV410数据集中截取的不同场景的图片 (a):lakes (b):buildings (c):forests (d):hills

2、Data Collection数据收集

Anti-UAV410数据集为了创造更为真实的环境,作者团队在各种各样的复杂环境进行视频捕获。这些场景包括白天和夜晚(光线不同)、秋天和冬天(季节不同),以及多种背景(建筑30%,山脉20%,森林5%,都市30%,云层10%,水面3%等)。能看出来背景的多样性的确要比Anti-UAV更好一些。

视频序列帧率为25FPS (跟Anti-UAV是一样的),在获取的视频序列中,作者团队选取了100minutes的视频进行了细致的逐帧标注,共计超过15万帧。同时,为了扩大数据规模,作者团队融合了Anti-UAV数据集和第一届Anti-UAV Challenge website的视频(对这里的视频都进行了裁剪和清洗,确保一致性和质量)。

由于Anti-UAV是双模态数据集,其中一些视频片段不适合用于individual TIR tracking(有些TIR video在第一帧是没有跟踪目标的,而visible video中有),因此作者团队抛弃了这部分的视频序列。

3、 Annotation标注

Anti-UAV410数据集的标注方法跟Anti-UAV是一样的,三阶段标注(不知道的同学移步【目标跟踪】Anti-UAV数据集详细介绍-CSDN博客),不同点在于:Anti-UAV数据集的真实框是以角点的形式给出的[x1,y1,x2, y2] ,Anti-UAV410数据集的真实框是以[x1, y1, w, h] 的形式给出的(x1, y1是边界框的左上角坐标),在没有跟踪目标的帧中真实框被设为0。

4、Statistics统计

Dataset Splitting

Anti-UAV410数据集中的训练集和验证集来自同一个视频的非重叠部分 ,而测试集则完全独立 于训练集和验证集。其中,训练集包含200个视频对,验证集包含90个视频对,测试集包含 1220个视频对。

三个子集在每个挑战属性上比例相对均匀,此时使用训练集可以更好地学习到无人机跟踪在野外场景下所面临的挑战。

Scale distribution

作者团队为了还原真实的无人机使用场景,专门提升了小尺寸目标在数据集中的比例。Anti-UAV410数据集中的帧大小为640×512。论文中还分析了其他数据集与Anti-UAV410数据集中目标尺寸。如下表所示。

Anti-UAV410数据集中的tiny目标尺寸只有10pixels,从上表中能很明显看出来Anti-UAV410数据集中tiny目标的数据量要远大于其他数据集。

Attribute Definition

Anti-UAV410数据集的属性设置和Anti-UAV数据集差不多新增了DBC的属性,也是在论文的introduction部分就专门提到的。从下表中能明显看出TC属性的视频序列数量是最多的,因为在实际场景中,热交叉在TIR视频中是非常容易遇到的。

5、Compared With Anti-UAV Dataset

这一部分内容博主就直接截屏原论文了(因为在前面的部分差不多都零零散散的提到了)。

相关推荐
Juchecar11 小时前
一文讲清 nn.Module 中 forward 函数被调用时机
人工智能
七牛云行业应用11 小时前
深度解析强化学习(RL):原理、算法与金融应用
人工智能·算法·金融
说私域11 小时前
“开源AI智能名片链动2+1模式S2B2C商城小程序”在直播公屏引流中的应用与效果
人工智能·小程序·开源
Hcoco_me12 小时前
深度学习和神经网络之间有什么区别?
人工智能·深度学习·神经网络
霍格沃兹_测试12 小时前
Ollama + Python 极简工作流
人工智能
资源开发与学习12 小时前
AI智时代:一节课带你玩转 Cursor,开启快速入门与实战之旅
人工智能
西安光锐软件12 小时前
深度学习之损失函数
人工智能·深度学习
补三补四12 小时前
LSTM 深度解析:从门控机制到实际应用
人工智能·rnn·lstm
astragin12 小时前
神经网络常见层速查表
人工智能·深度学习·神经网络
嘀咕博客12 小时前
文心快码Comate - 百度推出的AI编码助手
人工智能·百度·ai工具