GroupNet:基于多尺度神经网络的交互推理轨迹预测

2022 CVPR

论文:GroupNet: Multiscale Hypergraph Neural Networks for Trajectory Prediction with Relational Reasoning

1、介绍

过去的工作只考虑了有限关系推理的成对交互,因此提出了GroupNet,可以通过可训练的多尺度超图,用于对具有多个不同大小的群体交互进行建模,以数据驱动的方式学习这种多尺度超图拓扑,来提取更全面更群体化的交互;在学习时,为了学习交互embedding,提出三要素格式:神经交互强度、神经交互类别和每个类别函数

至少三个因素会影响智能体动态:

自我动量:已得到充分研究

瞬时意图:不可研究(MTR系列已经实现瞬时意图的学习)

社会交互:当前工作重点

2、GroupNet

GroupNet的核心是学习一个多尺度超图,其节点是智能体,超边是交互

详情可见DynGroupNet,当然在DynGroupNet中有所创新,具体是在平滑相关矩阵的变化处,但基本核心思想不变

神经网络信息传递也相同,最后得到智能体的embedding

3、GroupNet预测系统

3.1、编码阶段

首先将过去轨迹X-和未来轨迹X+分别输入给GroupNet,得到智能体未来和过去的embedding------V+和V-

将两个embedding连接后,分别通过两个MLP,得到未来轨迹分布的期望和方差,从该分布中采样得到潜变量z,和V-连接后输出为V_out

而在测试阶段,则从先验分布N~(0, λI)中采样,其中λ为一个超参数

3.2、解码阶段

残差解码器包含两个相同的解码快,输入V_out和X-(重建过去轨迹,避免信息丢失)

每个块由一个用于编码序列的 GRU 编码器和两个作为输出的 MLP 组成

最后再求和得到未来预测轨迹和重建过去轨迹

3.3、损失函数

损失由L2范数损失,KL散度损失,和多样性损失构成

相关推荐
angleboy818 分钟前
【原创】如何WIN 10/11系统下解决YOLOv13训练异常的安装指南
人工智能·深度学习·yolo
ZhuNian的学习乐园25 分钟前
LLM智能体调度:从ReAct到多智能体调度
人工智能·python·深度学习
小超同学你好25 分钟前
LangGraph 25. 实战:Agent资源优化怎么做?用 State 与条件边管理预算、取证与模型档位(附 SRE 分诊 demo)
人工智能·深度学习·语言模型
xianluohuanxiang39 分钟前
高精度气象:极端天气一来,零售最先出问题的不是客流,而是补货体系和损失控制
开发语言·人工智能·深度学习·机器学习·零售
d1z8881 小时前
(十八)32天GPU测试从入门到精通-TensorRT-LLM 部署与优化day16
人工智能·python·深度学习·gpu·tensorrt
深度学习lover2 小时前
<数据集>yolo微藻识别<目标检测>
人工智能·python·yolo·目标检测·计算机视觉·微藻识别
冰西瓜6002 小时前
深度学习的数学原理(二十七)—— 掩码注意力
人工智能·深度学习
aweiname20082 小时前
安装 Nunchaku
人工智能·深度学习·ai生视频
格林威2 小时前
Windows 实时性补丁(RTX / WSL2)
linux·运维·人工智能·windows·数码相机·计算机视觉·工业相机
丰。。2 小时前
3D高斯泼溅研究01
人工智能·深度学习·3d·强化学习·深度强化学习