FocalAD论文阅读

https://zhuanlan.zhihu.com/p/1918449364008964557

主要是两个模块:Ego-Local-Agents Interactor和Focal-Local-Agents Loss。

主要流程是:状态提取 --> 图嵌入--> 交互得分 --> k-邻居选择 --> Focal-Local-Agents Loss

其中图嵌入 ,分为节点和边。节点就是障碍物自己的状态进行MLP,边的话是和主车状态的差值来做MLP

交互得分 主要用到了MHCA (Multi-Head Cross Attention) 将主车和其他障碍物的信息进行交互

再用MLP联合输出一个增强的特征表示 h_inc及其交互得分s_i ,表示该agent对自车决策的贡献。不太明白的点是为什么MLP能够生成两个结果???

k-邻居选择 如果交互得分比较高,那么Q_motion就会加上agent的信息。Q_motion是个什么东西???Q_plan也会考虑这些agent的信息 Q_plan又是个什么东西???

Focal-Local-Agents Loss: 对于重要障碍物的轨迹loss再算一遍

整体看下来主要就是对最重要的障碍物进行了筛选,那么如何选择最终要的障碍物就成了关键问题

相关推荐
HollowKnightZ8 小时前
论文阅读笔记:Class-Incremental Learning: A Survey
论文阅读·笔记
Eastmount10 小时前
[论文阅读] (45)C&S24 AISL: 基于攻击意图驱动与序列学习方法的APT攻击检测
论文阅读·系统安全·溯源图·攻击意图·apt攻击检测
小明_GLC12 小时前
ITransformer: Inverted Transformers Are Effective for Time Series Forecasting
论文阅读
依夏c14 小时前
【论文笔记•(多智能体)】Ask Patients with Patience
论文阅读
明明真系叻14 小时前
2025.12.21论文阅读
论文阅读·量子计算
m0_6501082414 小时前
DSGN:基于深度立体几何网络的 3D 目标检测革新
论文阅读·3d目标检测·立体视觉·3d几何体积表示·端到端联合优化·dsgn
m0_6501082415 小时前
FlashLightNet:实时检测与分类静态和闪烁交通灯状态的端到端深度学习框架
论文阅读·自动驾驶·视觉单模态·交通灯状态检测·flashlightnet
m0_6501082415 小时前
PETR:多视图 3D 目标检测的位置嵌入变换新范式
论文阅读·自动驾驶·位置编码·视觉单模态·多视角3d目标检测·petr·3d位置信息与2d特征
Cuby!15 小时前
IEEE Wireless Communications 2025年论文整理2(中英文摘要)
论文阅读·学习·信息与通信
youcans_1 天前
【医学影像 AI】FunBench:评估多模态大语言模型的眼底影像解读能力
论文阅读·人工智能·大语言模型·多模态·眼底图像