FocalAD论文阅读

https://zhuanlan.zhihu.com/p/1918449364008964557

主要是两个模块:Ego-Local-Agents Interactor和Focal-Local-Agents Loss。

主要流程是:状态提取 --> 图嵌入--> 交互得分 --> k-邻居选择 --> Focal-Local-Agents Loss

其中图嵌入 ,分为节点和边。节点就是障碍物自己的状态进行MLP,边的话是和主车状态的差值来做MLP

交互得分 主要用到了MHCA (Multi-Head Cross Attention) 将主车和其他障碍物的信息进行交互

再用MLP联合输出一个增强的特征表示 h_inc及其交互得分s_i ,表示该agent对自车决策的贡献。不太明白的点是为什么MLP能够生成两个结果???

k-邻居选择 如果交互得分比较高,那么Q_motion就会加上agent的信息。Q_motion是个什么东西???Q_plan也会考虑这些agent的信息 Q_plan又是个什么东西???

Focal-Local-Agents Loss: 对于重要障碍物的轨迹loss再算一遍

整体看下来主要就是对最重要的障碍物进行了筛选,那么如何选择最终要的障碍物就成了关键问题

相关推荐
不解风水2 天前
【论文阅读】一种基于经典机器学习的肌电下肢意图检测方法,用于人机交互系统
论文阅读·人机交互
爱补鱼的猫猫2 天前
17、CryptoMamba论文笔记
论文阅读
大熊背2 天前
《Fast Automatic White Balancing Method by Color Histogram Stretching》论文笔记
论文阅读·白平衡
CV-杨帆3 天前
论文阅读 arxiv 2024 MemGPT: Towards LLMs as Operating Systems
论文阅读
AAA锅包肉批发3 天前
论文阅读:Aircraft Trajectory Prediction Model Based on Improved GRU Structure
论文阅读·深度学习·gru
星夜Zn3 天前
Nature论文-预测和捕捉人类认知的基础模型-用大模型模拟人类认知
论文阅读·人工智能·大语言模型·nature·认知建模·统一认知模型
dundunmm3 天前
【论文阅读】Deep Adversarial Multi-view Clustering Network
论文阅读·人工智能·深度学习·聚类·对抗网络·多视图聚类·深度多视图聚类
账户不存在4 天前
《Learning To Count Everything》论文阅读
论文阅读·pytorch·深度学习·无监督训练
CV-杨帆5 天前
论文阅读:AAAI 2024 ExpeL: LLM Agents Are Experiential Learners
论文阅读
万里鹏程转瞬至6 天前
论文阅读:DMD蒸馏 | One-step Diffusion with Distribution Matching Distillation
论文阅读