(2 封私信) DanceTrack: 相似外观和复杂运动的多目标追踪数据集 (CVPR2022) - 知乎https://opendatalab.org.cn/OpenDataLab/DanceTrack
简介:
时间:2022
期刊:CVPR
作者:Peize Sun,Jinkun Cao,Yi Jiang等

在视频多目标追踪领域,现在主要有两个路线的工作,一个是以车辆追踪为代表的高速刚体追踪,代表数据集有KITTI等;另外一类则是以行人追踪为代表的低速非刚体物体追踪,代表数据集有MOT17, MOT20等。
作者在多目标(行人)跟踪领域,提出了一个新的数据集DanceTrack。
现有数据集:
不足:
①目标运动模式简单,一般可近似为匀速线性运动;
②目标的外观差别很大,当目标的检测框准确时,外观相似度匹配可以很好的完成追踪任务。
特点:
①相较于匹配算法的改进,更加重视改善目标检测的性能;
②非常依赖外观匹配。
DanceTrack:
目的:
①强调一些被已有数据集所忽略的目标追踪线索,避免MOT变成完全的Detection + ReID;
②促进之后的算法在关注目标检测;
③在目标匹配上更多地关注目标外观之外的线索。
特点:
作者收集了100段视频,内容包括集体舞蹈、功夫、体操等。
①目标人物穿着相似甚至一致;
②目标之间有大量的遮挡和位置交错;
③目标的运动模式非常复杂多样,呈现明显的非线性,并且时常伴随多样的肢体动作。
展望未来:
①分析目标之间的位置和交互;
②外观之外的其他的匹配线索,如运动轨迹等。
对比MOT17与MOT20:
因为DanceTrack中的目标都非常清晰而且处于近景,所以目标检测一般不会成为算法的瓶颈。在下图,作者比较了DanceTrack和MOT17和MOT20的一些统计数据,帮助大家更直观的了解其宏观特点。为了强调算法的追踪性能,作者使用HOTA作为DanceTrack主要评价指标。

数据集:
介绍:
DanceTrack是一个多人类跟踪数据集,具有两个强调的属性 :
①外观均匀: 人类外观高度相似且几乎没有区别;
②运动多样: 人类处于复杂的运动模式中,并且它们的相对位置经常交换。
作者希望均匀的外观和复杂的运动模式相结合,使DanceTrack成为鼓励更全面,更智能的多目标跟踪算法的平台。
内容:
在下载链接中获取下载DanceTrack的原数据,主要结构如图所示

DanceTrack数据集包括测试集test,训练集train和验证集val;总共包含100段图片序列,并用DanceTrack0X命名,其中,测试集包括35段图片序列,训练集包括40段图片序列,验证集包括25段图片序列。

每段视频的长度大约为1min

格式如下图所示,包含gt文件、图片、和seqinfo.ini
