GameFormer论文阅读

参考博客:https://blog.csdn.net/m0_48100146/article/details/135683444

这篇文章的思路还是很清晰的,直接看图就能看懂

Modality Embedding Query是可学习的embedding, 类似于multipath++中的query
除了上述模型结构的特点,还增加了一个辅助判碰撞loss
目前对这篇论文还存在的疑惑的点:

  1. 每个level的trajectory都要进行监督吗? --- 是的,看开源代码是的
  2. Agent Future Mask是怎么做的? --- 在每次迭代的时候,将要迭代的障碍物的未来轨迹进行mask掉。防止模型在预测某个智能体未来时,利用到它自己未来的真实信息,保证训练/推理的公平性和泛化能力。

开源代码:https://github.com/MCZhi/GameFormer

相关推荐
数智工坊18 小时前
【Mask2Former论文阅读】:基于掩码注意力的通用分割Transformer,大一统全景/实例/语义分割
论文阅读·深度学习·transformer
大模型最新论文速读1 天前
Select to Think:蒸馏 token 排序能力,效果平均提升24%
论文阅读·人工智能·深度学习·机器学习·自然语言处理
chnyi6_ya1 天前
论文笔记 | RefineAnything:面向完美局部细节的多模态区域精细化
论文阅读·人工智能·学习
数智工坊2 天前
【SAM-DETR论文阅读】:基于语义对齐匹配的DETR极速收敛检测框架
网络·论文阅读·人工智能·深度学习·transformer
张较瘦_3 天前
[论文阅读] AI + 软件工程 | 突破LLM代码生成瓶颈:编程知识图谱(PKG)让检索增强更精准
论文阅读·人工智能·软件工程
传说故事3 天前
【论文阅读】HY-Embodied-0.5: Embodied Foundation Models for Real-World Agents
论文阅读·人工智能·机器人·具身智能
传说故事3 天前
【论文阅读】RISE: Self-Improving Robot Policy with Compositional World Model
论文阅读·人工智能·机器人·具身智能·世界模型
传说故事4 天前
【论文阅读】Diffusion Forcing: Next-token Prediction Meets Full-Sequence Diffusion
论文阅读·人工智能·diffusion
数智工坊5 天前
【SIoU Loss论文阅读】:引入角度感知的框回归损失,让检测收敛更快更准
论文阅读·人工智能·深度学习·机器学习·数据挖掘·回归·cnn
传说故事5 天前
【论文阅读】AWR:Simple and scalable off-policy RL
论文阅读·强化学习