主要特点:出轨迹是迭代了多次,每次出一条,然后去找和真值最近并且出现最早的轨迹,进行监督。
和QCNet一样loss是基于Laplace negative log-likelihood的。传统的WTA的策略只会监督和GT差异最小的那条轨迹。而EMTA策略会监督在RNN结构中找和GT match上的并且是相对更早decode出来的那条轨迹(也就是在RNN结构中认为概率更高的那条)。这里决定是不是match用的是Miss Rate的判定标准。如果没有match上的话,就退回WTA策略。这样就能让model尽早decode出目标的模态,也能提升Miss Rate的表现。
ModeSeq论文阅读
ZHANG8023ZHEN2025-08-03 13:15
相关推荐
HollowKnightZ10 小时前
论文阅读笔记:Class-Incremental Learning: A SurveyEastmount12 小时前
[论文阅读] (45)C&S24 AISL: 基于攻击意图驱动与序列学习方法的APT攻击检测小明_GLC14 小时前
ITransformer: Inverted Transformers Are Effective for Time Series Forecasting依夏c16 小时前
【论文笔记•(多智能体)】Ask Patients with Patience明明真系叻16 小时前
2025.12.21论文阅读m0_6501082417 小时前
DSGN:基于深度立体几何网络的 3D 目标检测革新m0_6501082417 小时前
FlashLightNet:实时检测与分类静态和闪烁交通灯状态的端到端深度学习框架m0_6501082418 小时前
PETR:多视图 3D 目标检测的位置嵌入变换新范式Cuby!18 小时前
IEEE Wireless Communications 2025年论文整理2(中英文摘要)youcans_1 天前
【医学影像 AI】FunBench:评估多模态大语言模型的眼底影像解读能力