论文阅读分享——UMDF（AAAI-24）

XAL12025-03-12 18:23

概述

题目：A Unified Self-Distillation Framework for Multimodal Sentiment Analysis with Uncertain Missing Modalities

发表：The Thirty-Eighth AAAI Conference on Artificial Intelligence (AAAI-24)

年份：2024

Github：暂无

现有针对缺失模态的方法可以分为两组：

现有方法存在的限制：

方法概述：论文提出了一种统一多模态缺失模态自蒸馏框架（UMDF），通过自蒸馏机制、多粒度跨模态交互模块和动态特征集成模块，在多模态情感分析中解决不确定缺失模态的问题，显著提升了在缺失模态和完整模态测试条件下的表现。

贡献：

在UMDF中设计了一种统一的自蒸馏机制，通过在单个网络内进行双向知识转移，从多模态数据表示的一致分布中自动学习鲁棒的固有表示。双向知识转移路径可以监督模型在异构模态缺失情况之间保持相似的特征分布和logits分布。这种有效的途径抑制了对学习特征的单向依赖，并且在两个方面是有益的：从更多模态到更少模态的知识转移有助于恢复丢失模态的丢失信息，而在相反的方向上，则增强了特定模态的特征。
提出了一种多粒度交跨模态交互模块，该模块逐步对缺失的模态执行粗粒度和细粒度跨模态注意。它可以分层捕获模态间的交互和模态内的动态，以补充和再现模态缺失元素的语义。
引入了一个动态特征集成模块，以进一步增强有益的语义，并通过帧级（frame-level）自增强和选择性过滤策略过滤冗余特征，以产生更精细的表示。基于这些组件，UMDF在三个多模态基准的不确定缺失模态和完整模态测试条件下显著提高了MSA的性能。

实验结果：