目标跟踪篇

一、多目标跟踪的定义

多目标跟踪的主要任务是:

在给定视频中同时对多个感兴趣的目标进行定位,并且维持他们的ID、记录他们的轨迹。

TBD(Tracking-by-Detection)策略:先检测,后跟踪

  • 图像帧的目标在哪里?---目标检测
  • 两帧图像中的目标怎么确定是同一个目标?---数据关联

二、多目标跟踪的流程

1、给定视频的原始帧;

2、运行对象检测器以获得对象的边界框;

3、对于每个检测到的物体,计算出不同的特征,通常是视觉和运动特征;

4、通过相似度计算两个对象属于同一目标的概率;

5、关联步骤,为每个对象分配数字ID。

三、Sort

四个核心步骤:

  • 1、获取目标检测框,(检测器:Faster R-CNN,YOLO);
  • 2、卡尔曼滤波器预测当前位置,获得预测框;
  • 3、进行相似度计算,计算前一帧和当前帧目标之间的匹配程度(只考虑运动信息);
  • 4、通过匈牙利算法进行数据关联,为每个对象分配目标的ID
    以"每个检测框"与"现有目标的所有预测框"之间的IOU作为前后帧之间目标关系的度量指标。

四、DeepSort

部分引用https://guo-pu.blog.csdn.net/article/details/122827312

五、基于DeepSort改进的多目标跟踪算法

针对标牌:

增加长宽比,类别约束,用标牌后分类模型提取特征

后续也有新的跟踪算法,比如BoT-SORT等。

六、MOT的衡量指标

主要从"准确性"(有没有跟对,跟得准不准)和"稳定性"(身份是否保持连贯)两个核心维度进行评估。

MOTA是最传统,最受关注的综合指标,它从错误的角度出发,简化为:

MOTA = 1 - (FN + FP + IDs) / 真实目标总数

因为它同时惩罚了检测错误(FN,FP)和跟踪错误(IDs),这三者分别代表漏报,误报和身份切换

相关推荐
AI科技星几秒前
《全域数学》第一部:数术本源·第二卷《算术原本》之十四附录(二)全域数学体系下三大数论猜想的本源推演与哲学阐释【乖乖数学】
人工智能·线性代数·机器学习·量子计算·agi
qcx23几秒前
拆解 Warp AI Agent(一):类型即协议——23 种 Action 的编译期安全设计
人工智能·安全·ai·agent·源码解析·warp
蔡俊锋几秒前
AI进阶运营:从信息爆炸到智能掌控
人工智能·chatgpt·ai进阶运营
weixin_511840472 分钟前
2026年4月23日 Hermes Agent 与 OpenClaw 深度对比研究
人工智能
乱世刀疤3 分钟前
如何写好GPT Image 2 提示词
人工智能
HERR_QQ4 分钟前
端到端课程自用 5 规划 基于Difussion 的端到端planner AI 笔记
人工智能·笔记·学习·自动驾驶
一点一木7 小时前
🚀 2026 年 4 月 GitHub 十大热门项目排行榜 🔥
人工智能·github
淡海水8 小时前
【AI模型】常见问题与解决方案
人工智能·深度学习·机器学习
HIT_Weston9 小时前
65、【Agent】【OpenCode】用户对话提示词(费米估算)
人工智能·agent·opencode
njsgcs9 小时前
我的知识是以图片保存的,我的任务状态可能也与图片有关,我把100张知识图片丢给vlm实时分析吗
人工智能