【目标跟踪】AntiUAV410数据集详细介绍

上一篇博客介绍了Anti-UAV数据集(【目标跟踪】Anti-UAV数据集详细介绍-CSDN博客),本篇将介绍Anti-UAV410,实际是在Anti-UAV数据集还存在的小问题进行了数据改进(不是对源数据直接修改,是新的数据集补齐了Anti-UAV的短板)。

还有一点要提前说明,Anti-UAV数据集是双模态的数据集 (RGB和TIR的视频对),Anti-UAV410是单模态的数据集(TIR视频)。

论文链接:Anti-UAV410: A Thermal Infrared Benchmark and Customized Scheme for Tracking Drones in the Wild | IEEE Journals & Magazine | IEEE Xplorehttps://ieeexplore.ieee.org/document/10325629代码链接:HwangBo94/Anti-UAV410: The benchmark of AntiUAV410.https://github.com/HwangBo94/Anti-UAV410/tree/main

1、Introduction概述

传统的热红外图像跟踪一般都是关注大尺寸的目标,并不适用与小目标跟踪(例如无人机)。虽然已经引入了Anti-UAV数据集来解决无人机跟踪的问题,但是还存在不能反映真实场景的局限。(也就是说,Anti-UAV410数据集的提出团队认为已有的Anti-UAV数据集没有很好的还原真实的无人机飞行场景

因此,提出了Anti-UAV410数据集,该数据集包含了410条序列(这也是数据集名字的由来),共有超过438k个边界框(标注的非常仔细了)。下图是从Anti-UAV410数据集中截取的不同场景的图片 (a):lakes (b):buildings (c):forests (d):hills

2、Data Collection数据收集

Anti-UAV410数据集为了创造更为真实的环境,作者团队在各种各样的复杂环境进行视频捕获。这些场景包括白天和夜晚(光线不同)、秋天和冬天(季节不同),以及多种背景(建筑30%,山脉20%,森林5%,都市30%,云层10%,水面3%等)。能看出来背景的多样性的确要比Anti-UAV更好一些。

视频序列帧率为25FPS (跟Anti-UAV是一样的),在获取的视频序列中,作者团队选取了100minutes的视频进行了细致的逐帧标注,共计超过15万帧。同时,为了扩大数据规模,作者团队融合了Anti-UAV数据集和第一届Anti-UAV Challenge website的视频(对这里的视频都进行了裁剪和清洗,确保一致性和质量)。

由于Anti-UAV是双模态数据集,其中一些视频片段不适合用于individual TIR tracking(有些TIR video在第一帧是没有跟踪目标的,而visible video中有),因此作者团队抛弃了这部分的视频序列。

3、 Annotation标注

Anti-UAV410数据集的标注方法跟Anti-UAV是一样的,三阶段标注(不知道的同学移步【目标跟踪】Anti-UAV数据集详细介绍-CSDN博客),不同点在于:Anti-UAV数据集的真实框是以角点的形式给出的[x1,y1,x2, y2] ,Anti-UAV410数据集的真实框是以[x1, y1, w, h] 的形式给出的(x1, y1是边界框的左上角坐标),在没有跟踪目标的帧中真实框被设为0。

4、Statistics统计

Dataset Splitting

Anti-UAV410数据集中的训练集和验证集来自同一个视频的非重叠部分 ,而测试集则完全独立 于训练集和验证集。其中,训练集包含200个视频对,验证集包含90个视频对,测试集包含 1220个视频对。

三个子集在每个挑战属性上比例相对均匀,此时使用训练集可以更好地学习到无人机跟踪在野外场景下所面临的挑战。

Scale distribution

作者团队为了还原真实的无人机使用场景,专门提升了小尺寸目标在数据集中的比例。Anti-UAV410数据集中的帧大小为640×512。论文中还分析了其他数据集与Anti-UAV410数据集中目标尺寸。如下表所示。

Anti-UAV410数据集中的tiny目标尺寸只有10pixels,从上表中能很明显看出来Anti-UAV410数据集中tiny目标的数据量要远大于其他数据集。

Attribute Definition

Anti-UAV410数据集的属性设置和Anti-UAV数据集差不多新增了DBC的属性,也是在论文的introduction部分就专门提到的。从下表中能明显看出TC属性的视频序列数量是最多的,因为在实际场景中,热交叉在TIR视频中是非常容易遇到的。

5、Compared With Anti-UAV Dataset

这一部分内容博主就直接截屏原论文了(因为在前面的部分差不多都零零散散的提到了)。

相关推荐
arbboter3 分钟前
【AI插件开发】Notepad++ AI插件开发1.0发布和使用说明
人工智能·大模型·notepad++·ai助手·ai插件·aicoder·notepad++插件开发
IT_Octopus15 分钟前
AI工程pytorch小白TorchServe部署模型服务
人工智能·pytorch·python
果冻人工智能20 分钟前
AI军备竞赛:我们是不是正在造一个无法控制的神?
人工智能
暴龙胡乱写博客26 分钟前
OpenCV---图像预处理(四)
人工智能·opencv·计算机视觉
程序员辣条33 分钟前
深度测评 RAG 应用评估框架:指标最全面的 RAGas
人工智能·程序员
curdcv_po34 分钟前
字节跳动Trae:一款革命性的免费AI编程工具完全评测
人工智能·trae
程序员辣条35 分钟前
为什么需要提示词工程?什么是提示词工程(prompt engineering)?为什么需要提示词工程?收藏我这一篇就够了!
人工智能·程序员·产品经理
孔令飞39 分钟前
Go:终于有了处理未定义字段的实用方案
人工智能·云原生·go
清流君1 小时前
【MySQL】数据库 Navicat 可视化工具与 MySQL 命令行基本操作
数据库·人工智能·笔记·mysql·ue5·数字孪生
Blossom.1181 小时前
人工智能在智能家居中的应用与发展
人工智能·深度学习·机器学习·智能家居·vr·虚拟现实·多模态融合