GameFormer论文阅读

参考博客:https://blog.csdn.net/m0_48100146/article/details/135683444

这篇文章的思路还是很清晰的,直接看图就能看懂

Modality Embedding Query是可学习的embedding, 类似于multipath++中的query
除了上述模型结构的特点,还增加了一个辅助判碰撞loss
目前对这篇论文还存在的疑惑的点:

  1. 每个level的trajectory都要进行监督吗? --- 是的,看开源代码是的
  2. Agent Future Mask是怎么做的? --- 在每次迭代的时候,将要迭代的障碍物的未来轨迹进行mask掉。防止模型在预测某个智能体未来时,利用到它自己未来的真实信息,保证训练/推理的公平性和泛化能力。

开源代码:https://github.com/MCZhi/GameFormer

相关推荐
HollowKnightZ10 小时前
论文阅读笔记:Class-Incremental Learning: A Survey
论文阅读·笔记
Eastmount12 小时前
[论文阅读] (45)C&S24 AISL: 基于攻击意图驱动与序列学习方法的APT攻击检测
论文阅读·系统安全·溯源图·攻击意图·apt攻击检测
小明_GLC14 小时前
ITransformer: Inverted Transformers Are Effective for Time Series Forecasting
论文阅读
依夏c16 小时前
【论文笔记•(多智能体)】Ask Patients with Patience
论文阅读
明明真系叻16 小时前
2025.12.21论文阅读
论文阅读·量子计算
m0_6501082417 小时前
DSGN:基于深度立体几何网络的 3D 目标检测革新
论文阅读·3d目标检测·立体视觉·3d几何体积表示·端到端联合优化·dsgn
m0_6501082417 小时前
FlashLightNet:实时检测与分类静态和闪烁交通灯状态的端到端深度学习框架
论文阅读·自动驾驶·视觉单模态·交通灯状态检测·flashlightnet
m0_6501082418 小时前
PETR:多视图 3D 目标检测的位置嵌入变换新范式
论文阅读·自动驾驶·位置编码·视觉单模态·多视角3d目标检测·petr·3d位置信息与2d特征
Cuby!18 小时前
IEEE Wireless Communications 2025年论文整理2(中英文摘要)
论文阅读·学习·信息与通信
youcans_1 天前
【医学影像 AI】FunBench:评估多模态大语言模型的眼底影像解读能力
论文阅读·人工智能·大语言模型·多模态·眼底图像