GroupNet:基于多尺度神经网络的交互推理轨迹预测

2022 CVPR

论文:GroupNet: Multiscale Hypergraph Neural Networks for Trajectory Prediction with Relational Reasoning

1、介绍

过去的工作只考虑了有限关系推理的成对交互,因此提出了GroupNet,可以通过可训练的多尺度超图,用于对具有多个不同大小的群体交互进行建模,以数据驱动的方式学习这种多尺度超图拓扑,来提取更全面更群体化的交互;在学习时,为了学习交互embedding,提出三要素格式:神经交互强度、神经交互类别和每个类别函数

至少三个因素会影响智能体动态:

自我动量:已得到充分研究

瞬时意图:不可研究(MTR系列已经实现瞬时意图的学习)

社会交互:当前工作重点

2、GroupNet

GroupNet的核心是学习一个多尺度超图,其节点是智能体,超边是交互

详情可见DynGroupNet,当然在DynGroupNet中有所创新,具体是在平滑相关矩阵的变化处,但基本核心思想不变

神经网络信息传递也相同,最后得到智能体的embedding

3、GroupNet预测系统

3.1、编码阶段

首先将过去轨迹X-和未来轨迹X+分别输入给GroupNet,得到智能体未来和过去的embedding------V+和V-

将两个embedding连接后,分别通过两个MLP,得到未来轨迹分布的期望和方差,从该分布中采样得到潜变量z,和V-连接后输出为V_out

而在测试阶段,则从先验分布N~(0, λI)中采样,其中λ为一个超参数

3.2、解码阶段

残差解码器包含两个相同的解码快,输入V_out和X-(重建过去轨迹,避免信息丢失)

每个块由一个用于编码序列的 GRU 编码器和两个作为输出的 MLP 组成

最后再求和得到未来预测轨迹和重建过去轨迹

3.3、损失函数

损失由L2范数损失,KL散度损失,和多样性损失构成

相关推荐
晚烛8 小时前
CANN 调试工具与性能剖析:从日志分析到 NPU 行为追踪的完整调试体系
开发语言·windows·python·深度学习·缓存
人月神话-Lee9 小时前
【图像处理】Sobel 边缘检测——让机器“看见“轮廓
图像处理·人工智能·计算机视觉·ios·ai编程·swift
手写码匠11 小时前
深入解析大模型架构之争:全能通用模型 vs 领域专精模型
人工智能·深度学习·算法·aigc
L、21814 小时前
CANN ops-transformer 仓库详解:Transformer 算子的底层实现与性能优化
深度学习·性能优化·transformer
嗝o゚14 小时前
昇腾CANN ge 仓的图优化 Pass:哪些 Pass 真正影响推理性能
pytorch·python·深度学习·cann·ge-pass
armwind14 小时前
数字图像处理-7-图像的梯度锐化算法
图像处理·计算机视觉
L、21815 小时前
昇腾NPU性能调优Checklist——从“能跑“到“跑得快“的20步
服务器·人工智能·深度学习
碧海银沙音频科技研究院15 小时前
恒玄bes2600WM+DSP蓝牙耳机项目
深度学习·语音识别
蓦然回首却已人去楼空15 小时前
深度学习进阶:自然语言处理|4.1.2 QA|grads 列表与省略号 [...] 详解
人工智能·深度学习·自然语言处理
手写码匠15 小时前
Android 17 适配实战指南:新特性解读、隐私变更与迁移全攻略
人工智能·深度学习·算法·aigc