MTR++论文阅读

https://zhuanlan.zhihu.com/p/654070149

文章亮点:

  1. Dense Future Prediction for All Agent:将预测的结果也encode起来,用于平衡障碍物之间的预测结果。不过在infer的时候这一部分不会进行
  2. 用数据集聚类获得query轨迹点(goal 点):将goal点也进行Transformer,并且让上一帧模型的结果用于下一帧的模型推理,可以使模型的推理更加具有连续性
  3. MTR是有agent视角来做坐标系的,MTR++是由主车视角来做坐标系的。
  4. MTR++中,对于intention query(goal点),也是转换到主车坐标系,同时会对所有障碍物的query一起进行编码,考虑障碍物之间的交互性。
相关推荐
薛定e的猫咪6 天前
【AAAI 2025】基于扩散模型的昂贵多目标贝叶斯优化
论文阅读·人工智能·算法
YMWM_6 天前
论文阅读“SimVLA: A Simple VLA Baseline for Robotic Manipulation“
论文阅读·vla
m0_650108246 天前
VLN-Zero:零样本机器人导航的神经符号视觉语言规划框架
论文阅读·零样本·机器人导航·视觉语言导航·未知环境快速适配·符号化场景图·vlm推理
晓山清7 天前
【论文阅读】Self-supervised Learning of Person-specific Facial Dynamics for APR
论文阅读
张较瘦_7 天前
[论文阅读] AI + 教育 | 不是单纯看视频!软件工程培训的游戏化融合之道
论文阅读·人工智能·软件工程
张较瘦_7 天前
[论文阅读] AI + 软件工程 | 用统计置信度破解AI功能正确性评估难题——SCFC方法详解
论文阅读·人工智能·软件工程
Matrix_118 天前
论文阅读--Agent AI 探索多模态交互的前沿领域(二)
论文阅读·人工智能
万里鹏程转瞬至9 天前
论文简读 | TurboDiffusion: Accelerating Video Diffusion Models by 100–200 Times
论文阅读·深度学习·aigc
Matrix_119 天前
论文阅读--Agent AI 探索多模态交互的前沿领域(一)
论文阅读·人工智能
@––––––10 天前
论文阅读笔记:π 0 : A Vision-Language-Action Flow Model for General Robot Control
论文阅读·笔记