GameFormer论文阅读

参考博客:https://blog.csdn.net/m0_48100146/article/details/135683444

这篇文章的思路还是很清晰的,直接看图就能看懂

Modality Embedding Query是可学习的embedding, 类似于multipath++中的query
除了上述模型结构的特点,还增加了一个辅助判碰撞loss
目前对这篇论文还存在的疑惑的点:

  1. 每个level的trajectory都要进行监督吗? --- 是的,看开源代码是的
  2. Agent Future Mask是怎么做的? --- 在每次迭代的时候,将要迭代的障碍物的未来轨迹进行mask掉。防止模型在预测某个智能体未来时,利用到它自己未来的真实信息,保证训练/推理的公平性和泛化能力。

开源代码:https://github.com/MCZhi/GameFormer

相关推荐
张较瘦_10 天前
[论文阅读] 软件工程 + 教学 | 软件工程项目管理课程改革:从传统教学到以学生为中心的混合式学习实践
论文阅读·学习·软件工程
青椒大仙KI1110 天前
论文笔记 <交通灯><多智能体>MetaLight:基于价值的元强化学习用于交通信号控制
论文阅读
莱茶荼菜10 天前
论文阅读-单目视觉惯性系统时间标定(二)
论文阅读
ZHANG8023ZHEN10 天前
SIMPL论文阅读
论文阅读
Catching Star10 天前
【论文笔记】【强化微调】T-GRPO:对视频数据进行强化微调
论文阅读
HollowKnightZ11 天前
论文阅读笔记:Digging Into Self-Supervised Monocular Depth Estimation
论文阅读·笔记
ZHANG8023ZHEN11 天前
FocalAD论文阅读
论文阅读
Catching Star11 天前
【论文笔记】【强化微调】TinyLLaVA-Video-R1:小参数模型也能视频推理
论文阅读·强化微调
青椒大仙KI1113 天前
论文笔记 <交通灯> IntelliLight:一种用于智能交通灯控制的强化学习方法
论文阅读