主要特点:出轨迹是迭代了多次,每次出一条,然后去找和真值最近并且出现最早的轨迹,进行监督。
和QCNet一样loss是基于Laplace negative log-likelihood的。传统的WTA的策略只会监督和GT差异最小的那条轨迹。而EMTA策略会监督在RNN结构中找和GT match上的并且是相对更早decode出来的那条轨迹(也就是在RNN结构中认为概率更高的那条)。这里决定是不是match用的是Miss Rate的判定标准。如果没有match上的话,就退回WTA策略。这样就能让model尽早decode出目标的模态,也能提升Miss Rate的表现。
ModeSeq论文阅读
ZHANG8023ZHEN2025-08-03 13:15
相关推荐
森诺Alyson4 小时前
前沿技术借鉴研讨-2025.10.28(超声数据)无问_z6 小时前
20251024No.Ada1 天前
基于脑电图(EEG)的认知负荷检测实验范式与深度神经网络的系统综述 论文笔记指针不指南吗1 天前
【论文阅读】图数据库 Survey: Graph Databases深蓝岛1 天前
LSTM与CNN融合建模的创新技术路径浣熊-论文指导2 天前
聚类与Transformer融合的六大创新方向深蓝岛2 天前
目标检测核心技术突破:六大前沿方向晚霞apple2 天前
特征融合与目标检测的六大创新方向DuHz2 天前
使用稀疏采样方法减轻汽车雷达干扰——论文阅读番茄寿司3 天前
具身智能六大前沿创新思路深度解析