FocalAD论文阅读

https://zhuanlan.zhihu.com/p/1918449364008964557

主要是两个模块:Ego-Local-Agents Interactor和Focal-Local-Agents Loss。

主要流程是:状态提取 --> 图嵌入--> 交互得分 --> k-邻居选择 --> Focal-Local-Agents Loss

其中图嵌入 ,分为节点和边。节点就是障碍物自己的状态进行MLP,边的话是和主车状态的差值来做MLP

交互得分 主要用到了MHCA (Multi-Head Cross Attention) 将主车和其他障碍物的信息进行交互

再用MLP联合输出一个增强的特征表示 h_inc及其交互得分s_i ,表示该agent对自车决策的贡献。不太明白的点是为什么MLP能够生成两个结果???

k-邻居选择 如果交互得分比较高,那么Q_motion就会加上agent的信息。Q_motion是个什么东西???Q_plan也会考虑这些agent的信息 Q_plan又是个什么东西???

Focal-Local-Agents Loss: 对于重要障碍物的轨迹loss再算一遍

整体看下来主要就是对最重要的障碍物进行了筛选,那么如何选择最终要的障碍物就成了关键问题

相关推荐
HollowKnightZ2 小时前
论文阅读笔记:Digging Into Self-Supervised Monocular Depth Estimation
论文阅读·笔记
Catching Star6 小时前
【论文笔记】【强化微调】TinyLLaVA-Video-R1:小参数模型也能视频推理
论文阅读·强化微调
青椒大仙KI111 天前
论文笔记 <交通灯> IntelliLight:一种用于智能交通灯控制的强化学习方法
论文阅读
Jamence1 天前
多模态大语言模型arxiv论文略读(130)
论文阅读·人工智能·深度学习·语言模型·论文笔记
张较瘦_2 天前
[论文阅读] 人工智能+软件工程 | 用大语言模型架起软件需求形式化的桥梁
论文阅读·人工智能·软件工程
张较瘦_2 天前
[论文阅读] 人工智能 + 软件工程 | USEagent:迈向统一的AI软件工程师
论文阅读·人工智能·软件工程
Jamence2 天前
多模态大语言模型arxiv论文略读(131)
论文阅读·人工智能·语言模型·自然语言处理·论文笔记
有Li2 天前
ULS23 挑战:用于计算机断层扫描中 3D 通用病变分割的基准模型及基准数据集|文献速递-深度学习医疗AI最新文献
论文阅读·深度学习·计算机视觉·医学生
R.X. NLOS2 天前
论文阅读笔记 | Qwen-VL:一个视觉语言大模型,通晓理解、定位、文本阅读等多种能力
论文阅读·笔记·大模型·多模态大模型·qwen-vl