【中国科学院光电研究所-张建林组-AAAI26】追踪不稳定目标：基于外观引导的运动建模在无人机拍摄视频中实现稳健的多目标跟踪

文章：Tracking the Unstable: Appearance-Guided Motion Modeling for Robust Multi-Object Tracking in UAV-Captured Videos

代码：暂无

单位：中国科学院光电研究所

无人机拍摄场景有两个核心痛点，让传统跟踪算法难以应对：

视角多变+运动复杂：无人机飞行时视角频繁切换（近拍变远拍、左拍变右拍），且与地面目标的相对运动剧烈，导致目标外观和位置变化极大；
传统方法"各自为战"：现有算法大多分开处理"目标外观"和"运动轨迹"信息，忽略了两者的内在关联。一旦目标突然位移或外观模糊，就容易出现跟踪断裂、身份认错的问题。

这些问题最终导致跟踪准确率低、轨迹碎片化，严重影响无人机在安防监控、交通疏导等场景的应用效果。

研究团队提出的AMOT算法，基于联合检测与嵌入（JDE）架构，核心创新在于两个"即插即用"的模块，完美解决了传统方法的缺陷：

AMC矩阵不再分开看"外观"和"运动"，而是通过双向空间距离计算，将两者深度融合：

针对目标被遮挡、漏检导致的轨迹断裂问题，MTC模块能"复活"失联轨迹：

更实用的是，这两个模块无需额外训练，能直接集成到现有JDE类跟踪器中，兼容性拉满。

研究团队在VisDrone2019、UAVDT、VT-MOT-UAV三大无人机跟踪基准数据集上做了充分测试，结果惊艳：

更关键的是，AMOT保持36.4 FPS的实时推理速度，完全满足无人机实时跟踪的需求。 ablation实验还证明，AMC和MTC模块联合使用时，能让身份切换次数大幅减少，轨迹连续性显著提升。

AMOT通过融合外观与运动信息的AMC矩阵和轨迹复活MTC模块，解决了无人机多目标跟踪中"匹配不准""轨迹断裂"的核心痛点，为实时、稳健的无人机监控提供了高效解决方案。