GameFormer论文阅读

参考博客:https://blog.csdn.net/m0_48100146/article/details/135683444

这篇文章的思路还是很清晰的,直接看图就能看懂

Modality Embedding Query是可学习的embedding, 类似于multipath++中的query
除了上述模型结构的特点,还增加了一个辅助判碰撞loss
目前对这篇论文还存在的疑惑的点:

  1. 每个level的trajectory都要进行监督吗? --- 是的,看开源代码是的
  2. Agent Future Mask是怎么做的? --- 在每次迭代的时候,将要迭代的障碍物的未来轨迹进行mask掉。防止模型在预测某个智能体未来时,利用到它自己未来的真实信息,保证训练/推理的公平性和泛化能力。

开源代码:https://github.com/MCZhi/GameFormer

相关推荐
薛定e的猫咪5 天前
【AAAI 2025】基于扩散模型的昂贵多目标贝叶斯优化
论文阅读·人工智能·算法
YMWM_5 天前
论文阅读“SimVLA: A Simple VLA Baseline for Robotic Manipulation“
论文阅读·vla
m0_650108245 天前
VLN-Zero:零样本机器人导航的神经符号视觉语言规划框架
论文阅读·零样本·机器人导航·视觉语言导航·未知环境快速适配·符号化场景图·vlm推理
晓山清6 天前
【论文阅读】Self-supervised Learning of Person-specific Facial Dynamics for APR
论文阅读
张较瘦_6 天前
[论文阅读] AI + 教育 | 不是单纯看视频!软件工程培训的游戏化融合之道
论文阅读·人工智能·软件工程
张较瘦_6 天前
[论文阅读] AI + 软件工程 | 用统计置信度破解AI功能正确性评估难题——SCFC方法详解
论文阅读·人工智能·软件工程
Matrix_117 天前
论文阅读--Agent AI 探索多模态交互的前沿领域(二)
论文阅读·人工智能
万里鹏程转瞬至7 天前
论文简读 | TurboDiffusion: Accelerating Video Diffusion Models by 100–200 Times
论文阅读·深度学习·aigc
Matrix_118 天前
论文阅读--Agent AI 探索多模态交互的前沿领域(一)
论文阅读·人工智能
@––––––9 天前
论文阅读笔记:π 0 : A Vision-Language-Action Flow Model for General Robot Control
论文阅读·笔记