FocalAD论文阅读

https://zhuanlan.zhihu.com/p/1918449364008964557

主要是两个模块:Ego-Local-Agents Interactor和Focal-Local-Agents Loss。

主要流程是:状态提取 --> 图嵌入--> 交互得分 --> k-邻居选择 --> Focal-Local-Agents Loss

其中图嵌入 ,分为节点和边。节点就是障碍物自己的状态进行MLP,边的话是和主车状态的差值来做MLP

交互得分 主要用到了MHCA (Multi-Head Cross Attention) 将主车和其他障碍物的信息进行交互

再用MLP联合输出一个增强的特征表示 h_inc及其交互得分s_i ,表示该agent对自车决策的贡献。不太明白的点是为什么MLP能够生成两个结果???

k-邻居选择 如果交互得分比较高,那么Q_motion就会加上agent的信息。Q_motion是个什么东西???Q_plan也会考虑这些agent的信息 Q_plan又是个什么东西???

Focal-Local-Agents Loss: 对于重要障碍物的轨迹loss再算一遍

整体看下来主要就是对最重要的障碍物进行了筛选,那么如何选择最终要的障碍物就成了关键问题

相关推荐
0x21121 小时前
[论文阅读]Through the Stealth Lens: Rethinking Attacks and Defenses in RAG
论文阅读
川西胖墩墩2 天前
团队协作泳道图制作工具 PC中文免费
大数据·论文阅读·人工智能·架构·流程图
starsky_walker2 天前
【论文阅读笔记】--SOSP2025--Proto: A Guided Journey through Modern OS Construction
论文阅读·笔记
MoonOutCloudBack2 天前
Nash-MTL:在多任务梯度组合中引入纳什谈判解
论文阅读·人工智能·深度学习·机器学习·多任务·帕累托最优
大猪宝宝学AI3 天前
【AI Infra】SonicMoE论文笔记
论文阅读·人工智能·性能优化
我要学脑机3 天前
[脑磁图+PD综述]文献阅读记录
论文阅读
EEPI3 天前
【论文阅读】RoboReward: General-Purpose Vision-Language Reward Models for Robotics
论文阅读
小明_GLC3 天前
MDMLP-EIA时序论文阅读
论文阅读
m0_650108243 天前
P2PNet:基于点的密集人群计数与定位
论文阅读·深度学习·人群计数与定位·基于头部中心点·p2pnet
m0_650108244 天前
WorldSplat:面向自动驾驶的 4D 场景生成与新颖视图合成框架
论文阅读·自动驾驶·高保真·时空一致性·4d驾驶场景合成·生成式与重建式融合·4d高斯