DanceTrack数据集介绍

(2 封私信) DanceTrack: 相似外观和复杂运动的多目标追踪数据集 (CVPR2022) - 知乎https://opendatalab.org.cn/OpenDataLab/DanceTrack

简介:

时间:2022

期刊:CVPR

作者:Peize Sun,Jinkun Cao,Yi Jiang等

在视频多目标追踪领域,现在主要有两个路线的工作,一个是以车辆追踪为代表的高速刚体追踪,代表数据集有KITTI等;另外一类则是以行人追踪为代表的低速非刚体物体追踪,代表数据集有MOT17, MOT20等。

作者在多目标(行人)跟踪领域,提出了一个新的数据集DanceTrack。

现有数据集:

不足:

①目标运动模式简单,一般可近似为匀速线性运动;

②目标的外观差别很大,当目标的检测框准确时,外观相似度匹配可以很好的完成追踪任务。

特点:

①相较于匹配算法的改进,更加重视改善目标检测的性能;

②非常依赖外观匹配。

DanceTrack:

目的:

①强调一些被已有数据集所忽略的目标追踪线索,避免MOT变成完全的Detection + ReID;

②促进之后的算法在关注目标检测;

③在目标匹配上更多地关注目标外观之外的线索。

特点:

作者收集了100段视频,内容包括集体舞蹈、功夫、体操等。

①目标人物穿着相似甚至一致;

②目标之间有大量的遮挡和位置交错;

③目标的运动模式非常复杂多样,呈现明显的非线性,并且时常伴随多样的肢体动作。

展望未来:

①分析目标之间的位置和交互;

②外观之外的其他的匹配线索,如运动轨迹等。

对比MOT17与MOT20:

因为DanceTrack中的目标都非常清晰而且处于近景,所以目标检测一般不会成为算法的瓶颈。在下图,作者比较了DanceTrack和MOT17和MOT20的一些统计数据,帮助大家更直观的了解其宏观特点。为了强调算法的追踪性能,作者使用HOTA作为DanceTrack主要评价指标。

数据集:

介绍:

DanceTrack是一个多人类跟踪数据集,具有两个强调的属性 :

①外观均匀: 人类外观高度相似且几乎没有区别;

②运动多样: 人类处于复杂的运动模式中,并且它们的相对位置经常交换。

作者希望均匀的外观和复杂的运动模式相结合,使DanceTrack成为鼓励更全面,更智能的多目标跟踪算法的平台。

内容:

在下载链接中获取下载DanceTrack的原数据,主要结构如图所示

DanceTrack数据集包括测试集test,训练集train和验证集val;总共包含100段图片序列,并用DanceTrack0X命名,其中,测试集包括35段图片序列,训练集包括40段图片序列,验证集包括25段图片序列。

每段视频的长度大约为1min

格式如下图所示,包含gt文件、图片、和seqinfo.ini

相关推荐
甲维斯1 小时前
用AI还原《坦克大战》并3D化升级!
前端·人工智能·游戏开发
IT_陈寒2 小时前
SpringBoot自动配置坑了我一晚上,原来问题出在这
前端·人工智能·后端
吴佳浩3 小时前
Hermes Agent 连环 400 真凶找到了:一个 call_id 让人炸毛
人工智能·llm·agent
程序员cxuan3 小时前
幽默,一个 Github 名字叫“马尾辫”,但是他给你省了 80% 的 token
人工智能·后端·程序员
宋哥转AI4 小时前
Agent记忆模块系列:03存储与检索链路实测验证
人工智能·agent
老金带你玩AI4 小时前
老金开源GoalPro,别让AI把目标越写越烂
人工智能
Bigfish_coding4 小时前
前端转agent-【python】-08 用 LangGraph 把 Agent 做成状态机:像写 Vue 3 状态管理一样编排 AI 流程
人工智能
刺猬的温驯5 小时前
语音克隆模型的难点之一:音素对齐及交叉注意力早期失效问题 (兼论旋转位置编码)——F5-TTS、SupertonicTTS、VoxFlash-TTS 对比
人工智能·语音合成·tts
道友可好5 小时前
AI 是最好的混乱放大器:代码熵管理实战
前端·人工智能·后端