【论文阅读】BoT-SORT: Robust Associations Multi-Pedestrian Tracking

题目:BoT-SORT: Robust Associations Multi-Pedestrian Tracking

作者:Nir Aharon* Roy Orfaig Ben-Zion Bobrovsky

motivation:

作者来得很直接,就说他们用相机运动模型和优化卡尔曼做了个可以解决具有挑战的跟踪问题的算法:BOT-SORT;说他们在MOT17&20上表现是最好的。 你就说作者牛不牛。

pipline是这个样子。

methods:

1)优化卡尔曼滤波

作者把状态量改了

=>

2)相机运动补偿方式改进bounding box的预测;

图示,得到了优化;这部分相机运动补偿的工作StrongSORT也有做过,使用的是ECC方法;

  1. 加入Re-ID的度量,提高跟踪的准确度。
    用ResNeSt50做的FastRid库;
    特征表征用的指数移动平均,如下:

    代价函数用的是特征代价矩阵和运动代价的加权;

    引入IOU和余弦相似度表征距离,计算相似度:

experiments:

效果依然是最棒的!

【完结】

相关推荐
m0_6501082411 小时前
MindDrive:融合世界模型与视觉语言模型的端到端自动驾驶框架
论文阅读·自动驾驶·轨迹生成与规划·世界动作模型·e2e-ad·vlm导向评估器·minddrive
CoookeCola12 小时前
无需抠图!Qwen-Image-Layered 一键分解图像图层,支持图层级精准编辑
论文阅读·深度学习·计算机视觉·ai作画·开源·视觉检测·aigc
bylander12 小时前
【论文阅读】VTP:Towards Scalable Pre-training of Visual Tokenizers for Generation
论文阅读·图像处理·大模型
czijin12 小时前
【论文阅读】LoRA: Low-Rank Adaptation of Large Language Models
论文阅读·人工智能·语言模型
有Li13 小时前
诊断文本引导的分层分类全玻片图像表征学习|文献速递-医疗影像分割与目标检测最新技术
论文阅读·深度学习·文献·医学生
万里鹏程转瞬至1 天前
论文简读:Qwen2.5-VL Technical Report
论文阅读·深度学习·多模态
万里鹏程转瞬至1 天前
论文简读:Qwen3-VL Technical Report | Qwen3VL技术报告
论文阅读·深度学习·多模态
墨绿色的摆渡人2 天前
论文笔记(一百一十二)Pos3R: 6D Pose Estimation for Unseen Objects Made Easy
论文阅读
c0d1ng2 天前
十二月第三周周报(论文阅读)
论文阅读
Xy-unu2 天前
[LLM]AIM: Adaptive Inference of Multi-Modal LLMs via Token Merging and Pruning
论文阅读·人工智能·算法·机器学习·transformer·论文笔记·剪枝