MTR++论文阅读

https://zhuanlan.zhihu.com/p/654070149

文章亮点:

  1. Dense Future Prediction for All Agent:将预测的结果也encode起来,用于平衡障碍物之间的预测结果。不过在infer的时候这一部分不会进行
  2. 用数据集聚类获得query轨迹点(goal 点):将goal点也进行Transformer,并且让上一帧模型的结果用于下一帧的模型推理,可以使模型的推理更加具有连续性
  3. MTR是有agent视角来做坐标系的,MTR++是由主车视角来做坐标系的。
  4. MTR++中,对于intention query(goal点),也是转换到主车坐标系,同时会对所有障碍物的query一起进行编码,考虑障碍物之间的交互性。
相关推荐
CV-杨帆4 小时前
论文阅读:arxiv 2025 Chain of Draft: Thinking Faster by Writing Less
论文阅读
LuH11246 小时前
【论文阅读笔记】ICLR 2025 | 解析Ref-Gaussian如何实现高质量可交互反射渲染
论文阅读·笔记·论文笔记
Jamence15 小时前
多模态大语言模型arxiv论文略读(118)
论文阅读·人工智能·语言模型·自然语言处理·论文笔记
zsq1 天前
【论文阅读笔记】HaDes幻觉检测benchmark
论文阅读·笔记·nlp·大语言模型幻觉
*Lisen1 天前
论文笔记 -《MegaBlocks- Efficient Sparse Training with Mixture-of-Experts》
论文阅读
@Mr_LiuYang1 天前
Delivering Arbitrary-Modal Semantic Segmentation(CVPR2023)任意模态语义分割论文阅读
论文阅读·多模态融合·跨模态分割·deliver数据集·cmnext模型·并行池化混合器(ppx)·自查询中心(sq-hub)
*Lisen1 天前
论文笔记 - 《Implementing block-sparse matrix multiplication kernels using Triton》
论文阅读
有Li1 天前
分割任意组织:用于医学图像分割的单样本参考引导免训练自动点提示方法|文献速递-深度学习医疗AI最新文献
论文阅读·深度学习·计算机视觉
Jamence1 天前
多模态大语言模型arxiv论文略读(119)
论文阅读·人工智能·语言模型·自然语言处理·论文笔记