MTR++论文阅读

https://zhuanlan.zhihu.com/p/654070149

文章亮点:

  1. Dense Future Prediction for All Agent:将预测的结果也encode起来,用于平衡障碍物之间的预测结果。不过在infer的时候这一部分不会进行
  2. 用数据集聚类获得query轨迹点(goal 点):将goal点也进行Transformer,并且让上一帧模型的结果用于下一帧的模型推理,可以使模型的推理更加具有连续性
  3. MTR是有agent视角来做坐标系的,MTR++是由主车视角来做坐标系的。
  4. MTR++中,对于intention query(goal点),也是转换到主车坐标系,同时会对所有障碍物的query一起进行编码,考虑障碍物之间的交互性。
相关推荐
s1ckrain9 小时前
【论文阅读】DeepEyes: Incentivizing “Thinking with Images” via Reinforcement Learning
论文阅读·强化学习·多模态大模型·vlm
张较瘦_1 天前
[论文阅读] 人工智能 + 软件工程 | 需求获取访谈中LLM生成跟进问题研究:来龙去脉与创新突破
论文阅读·人工智能
北京地铁1号线2 天前
GPT-2论文阅读:Language Models are Unsupervised Multitask Learners
论文阅读·gpt·语言模型
张较瘦_2 天前
[论文阅读] 人工智能 + 软件工程 | 软件架构中自然问题主动辅助研究:从挑战到解决方案
论文阅读·人工智能·软件工程
有Li2 天前
通过具有一致性嵌入的大语言模型实现端到端乳腺癌放射治疗计划制定|文献速递-最新论文分享
论文阅读·深度学习·分类·医学生
张较瘦_2 天前
[论文阅读] 人工智能 | 深度学习系统崩溃恢复新方案:DaiFu框架的原位修复技术
论文阅读·人工智能·深度学习
selia10783 天前
[论文阅读] Neural Architecture Search: Insights from 1000 Papers
论文阅读
寻丶幽风3 天前
论文阅读笔记——NoPoSplat
论文阅读·笔记·三维重建·3dgs·相机位姿·dustr
寻丶幽风3 天前
论文阅读笔记——VGGT: Visual Geometry Grounded Transformer
论文阅读·笔记·transformer·三维重建·3dgs·vggt
张较瘦_3 天前
[论文阅读] 人工智能 + 软件工程 | Call Me Maybe:用图神经网络增强JavaScript调用图构建
论文阅读·人工智能·软件工程