论文阅读分享——UMDF(AAAI-24)

概述

题目:A Unified Self-Distillation Framework for Multimodal Sentiment Analysis with Uncertain Missing Modalities

发表:The Thirty-Eighth AAAI Conference on Artificial Intelligence (AAAI-24)

年份:2024

Github:暂无

现有针对缺失模态的方法可以分为两组:

  • 联合学习方法:试图学习不同模态中的基于关系(relation)的聚合表示
  • 生成式方法:利用可获得的模态重构缺失的模态

现有方法存在的限制:

  • 仅执行固定模态缺失案例之间的交互,无法解决随机的现实场景
  • 仅关注缺失模态中粗粒度和局部的交互,导致不鲁棒的联合表示和无效的元素相关性
  • 忽略了多模态表示中的冗余语义,导致性能瓶颈

方法概述:论文提出了一种统一多模态缺失模态自蒸馏框架(UMDF),通过自蒸馏机制、多粒度跨模态交互模块和动态特征集成模块,在多模态情感分析中解决不确定缺失模态的问题,显著提升了在缺失模态和完整模态测试条件下的表现。

贡献:

  • 在UMDF中设计了一种统一的自蒸馏机制,通过在单个网络内进行双向知识转移,从多模态数据表示的一致分布中自动学习鲁棒的固有表示。双向知识转移路径可以监督模型在异构模态缺失情况之间保持相似的特征分布和logits分布。这种有效的途径抑制了对学习特征的单向依赖,并且在两个方面是有益的:从更多模态到更少模态的知识转移有助于恢复丢失模态的丢失信息,而在相反的方向上,则增强了特定模态的特征。
  • 提出了一种多粒度交跨模态交互模块,该模块逐步对缺失的模态执行粗粒度和细粒度跨模态注意。它可以分层捕获模态间的交互和模态内的动态,以补充和再现模态缺失元素的语义。
  • 引入了一个动态特征集成模块,以进一步增强有益的语义,并通过帧级(frame-level)自增强和选择性过滤策略过滤冗余特征,以产生更精细的表示。基于这些组件,UMDF在三个多模态基准的不确定缺失模态和完整模态测试条件下显著提高了MSA的性能。

实验结果:

相关推荐
张较瘦_1 天前
[论文阅读] AI+ | AI如何重塑审计行业?从“手工筛查”到“智能决策”:AI审计的核心逻辑与未来路径
论文阅读·人工智能
苦瓜汤补钙1 天前
论文阅读——Segment Anything(Meta AI)——SAM
论文阅读·图像处理·人工智能·nlp·ai编程
CV-杨帆1 天前
论文阅读:arxiv 2025 Safety in Large Reasoning Models: A Survey
论文阅读
张较瘦_2 天前
[论文阅读] AI | 大语言模型服务系统服务级目标和系统级指标优化研究
论文阅读·人工智能·语言模型
Vizio<2 天前
《基于电阻层析成像(ERT)的机器人皮肤空间灵敏度均衡:通过应变系数分布优化》ICRA 2025 论文解读
论文阅读·机器人·机器人触觉
三木今天学习了嘛3 天前
【VLA & Markov】VLA 架构和构建模块 与 Markov 带来的时序思考
论文阅读
依夏c3 天前
[论文笔记•(多智能体)]LLMs Can Simulate Standardized Patients via Agent Coevolution
论文阅读·论文笔记
wzx_Eleven3 天前
【论文阅读】AAAI 2025 | 面向精确分割式联邦学习的多模型聚合与知识重放
论文阅读·人工智能·机器学习
Zack_Liu3 天前
LSS论文阅读
论文阅读·人工智能·目标跟踪
何如千泷3 天前
【论文阅读】SelfReg-UNet: Self-Regularized UNet for Medical Image Segmentation
论文阅读