RockTrack:A 3D Robust Multi-Camera-Ken Multi-Object Tracking Framework

RockTrack: A 3D Robust Multi-Camera-Ken Multi-Object Tracking Framework

基础信息

  1. 单位:哈尔滨理工大学
  2. 论文:https://arxiv.org/pdf/2409.11749
  3. 代码:https://github.com/lixiaoyu2000/Rock-Track (未全部放出)
  4. 数据集:nuScenes

摘要

  1. 随着检测技术的提高,多目标跟踪算法快速发展,特别是经济实惠的多相机跟踪。
  2. 现有的多相机端到端跟踪技术,由于训练的原因,导致局限于单一的检测器,导致灵活性降低了。
  3. 此外,目前的通用跟踪器忽略了多摄像机检测器的特性,比如:运动观测的不可靠性和视觉信息的可行性。
  4. 为了解决这些挑战,本文提出了RockTrack,一种用于多相机检测器的3D MOT方法。
  5. 遵循TBD框架,RockTrack与各种现成的探测器兼容。
  6. RockTrack包含了一个置信引导的预处理模块,从单个探测器的不同表示空间中提取可靠的运动和图像观测结果。
  7. 然后将这些观察结果融合在一个关联模块中,该模块利用几何和外观线索来减少不匹配。
  8. 得到的匹配通过分阶段估计过程传播,形成启发式噪声建模的基础。
  9. 此外,我们引入了一种新的外观相似度量,明确地描述对象亲和力在多相机设置。
    10.RockTrack在59.1%的AMOTA的视觉跟踪排行榜上取得了最先进的性能,同时展示了令人印象深刻的计算效率。

引言

contributions

  1. 我们提出了RockTrack,一种基于TBD框架的鲁棒和灵活的3D MOT方法,专门为多视图探测器设计。

  2. 我们引入了一种新的多视图外观相似度度量来明确地捕获对象间的亲和力(affinity)

  3. 我们开发了一个可扩展的几何滤波器和适应运动测量噪声,以提高空间可靠性在多相机探测器。我们还提出了一种伪视觉跟踪器滤波器,并实现了多模态匹配,以有效地利用视觉信息。

  4. RockTrack建立了一个新的最先进的,59.1%的AMOTA在仅相机test排行榜(多镜头跟踪)。

相关工作

Camera-only 3D Detection.

Camera-only 3D MOT.

方法

A. Confidence-Guided Pre-Processing Module

B. Motion-Appearance Data Association Module

C. Noise-Adaptive Motion Module

D. Lifecycle Module

实验

阅读时间(2024年9月19日)
相关推荐
Coovally AI模型快速验证27 分钟前
CVPR 2026|PanDA:首个多模态3D全景分割的无监督域适应框架
人工智能·3d·视觉检测·工业质检
AGV算法笔记5 小时前
CVPR 2024顶级SLAM论文精读:SplaTAM如何用3D高斯实现稠密RGB-D SLAM?
深度学习·3d·机器人视觉·slam·三维重建
hhhhhh_we6 小时前
皮肤人格的工程化实现:预颜美历如何用3D点云与循环神经网络构建数字孪生人格
图像处理·人工智能·rnn·深度学习·神经网络·3d·产品运营
Coovally AI模型快速验证6 小时前
YOLO26仓储检测实战:物体定位+有向边界框+姿态估计+实例分割,一个模型盯住整个仓库
大数据·人工智能·3d·视觉检测·工业质检
三维频道7 小时前
柔性材料3D数字化:蓝光扫描在内衣胸垫设计与质检中的应用
人工智能·3d·逆向工程·蓝光3d扫描仪·服装数字化·内衣设计·柔性材料检测
三维频道9 小时前
岩土力学微观探索:蓝光3D扫描在断面粗糙度分析中的应用
3d·新拓三维·xtom·蓝光3d扫描仪·岩土力学·结构面粗糙度·jrc
不知名的老吴9 小时前
渲染器Corona 11.2 for 3ds Max全流程下载与安装指南
3d
LateFrames1 天前
5 种 3D 模型文件格式比对( .asc / .stl / .obj / .ply / .3mf )
3d
dgaf1 天前
DX12 快速教程(17) —— 立体图标与合并渲染
c语言·c++·3d·图形渲染·d3d12
动恰客流管家1 天前
动恰3DV3丨客流统计系统:旺季人手不够淡季闲人太多?客流统计帮你科学优化人力成本
大数据·运维·人工智能·3d