论文推荐|迁移学习+多模态特征融合

来gongzhonghao**【图灵学术计算机论文辅导】**,快速拿捏更多计算机SCI/CCF发文资讯~

在Cvpr、NeurIPS、AAAI等顶会中,迁移学习+多模态特征融合正以"降成本、提性能、省标注"的绝对优势成为最热赛道。

面对超大模型全量微调天价算力、异构模态对齐难、跨域数据稀缺三大痛点,前沿工作正把"参数即知识"的理念玩到极致,谁能率先解锁跨架构、跨任务、跨模态的统一迁移框架,谁就能在下一轮顶会审稿中秒拿高分。

本文精心整理了3 篇前沿论文,旨在助力大家洞悉前沿动态、把握研究思路。满满干货,点赞收藏不迷路~

Multimodal Representation Learning by Alternating Unimodal Adaptation

**方法:**这篇文章针对多模态学习中"某些模态主导、其余被忽视"的顽疾,提出 MLA 框架,把传统联合训练拆成"各模态轮流独立优化"的交替单模态学习;在共享头里用梯度正交化机制防止新模态覆盖旧模态知识;推理阶段再用不确定性加权融合各模态预测,从而兼顾信息平衡与跨模态交互。

创新点:

  • 提出交替单模态学习范式,彻底解除模态间梯度干扰;

  • 设计梯度正交化矩阵,解决共享头在多轮更新中的跨模态遗忘;

  • 构建基于预测不确定性的测试时动态融合,自动权衡缺失或弱模态贡献。

**总结:**作者将联合训练拆为轮询式单模态优化,借助正交梯度锁定共享头记忆,再以不确定性权重整合推理输出,在五个数据集上显著抑制模态懒惰并刷新完整与缺失模态场景的 SOTA。

MergeNet: Knowledge Migration across Heterogeneous Models, Tasks, and Modalities

**方法:**这篇文章打破传统知识蒸馏与共享骨干的局限,提出MergeNet,通过低秩参数重编码与参数适配器在异构模型、任务、模态之间直接迁移知识,并在训练中以周期交替的知识迁移与自学习阶段动态整合源模型参数信息。

创新点:

  • 首次将模型参数视为通用知识载体,实现跨架构、跨任务、跨模态的无缝迁移;

  • 引入低秩参数知识适配器LPKA,通过可学习的行/列注意力融合源与目标模型参数,避免直接覆盖造成知识冲突;

  • 设计周期性知识迁移与自学习交替的训练机制,使目标模型按需提取源模型知识并自我巩固。

**总结:**作者先用低秩分解把异构模型参数压缩成可交互的低秩矩阵,再用LPKA在行/列维度以注意力方式融合双方知识,生成兼具源模型经验与目标模型结构的混合参数;训练时按固定周期插入知识迁移步骤,其余时间保留自学习更新,确保迁移既及时又不过度干扰;测试阶段移除参数适配器,实现零额外开销的推理,在跨结构、跨模态、跨任务三类挑战性场景上均显著优于现有方法。

纠结选题?导师放养?投稿被拒?对论文有任何问题的同学,欢迎来gongzhonghao【图灵学术计算机论文辅导】,获取顶会顶刊前沿资讯~

BIG-FUSION: Brain-Inspired Global-Local Context Fusion Framework for Multimodal Emotion Recognition in Conversations

**方法:**这篇文章针对对话多模态情感识别中全局主题与局部说话者依赖难以并行建模且相互干扰的顽疾,提出脑启发的BIG-FUSION框架,用双注意力Transformer同时捕获全局上下文与滑动窗局部信息,并在图对比学习中引入全局-局部双重节点重要性评估,再以脉冲神经元动态增强跨模态交互,实现生物可信的情感识别。

创新点:

  • 首次设计双注意力Transformer并行提取全局与局部上下文,避免序列式偏差;

  • 提出全局-局部双重评估的图增强策略,保留关键节点语义;

  • 将脉冲神经元动力学嵌入注意力机制,提升多模态整合与生物可解释性。

**总结:**作者先用双注意力Transformer并行输出全局与局部表征,经脉冲编码强化跨模态交互后初始化图节点;再用基于互信息的全局-局部双重指标评估节点重要性以生成增强视图,通过图对比学习精炼表征;最后融合分类损失与对比损失联合训练,在两个基准对话数据集上显著超越现有方法。

关注gongzhonghao**【图灵学术计算机论文辅导】**,快速拿捏更多计算机SCI/CCF发文资讯~

相关推荐
居然JuRan1 天前
从零开始学大模型之预训练语言模型
人工智能
沐怡旸1 天前
【算法--链表】114.二叉树展开为链表--通俗讲解
算法·面试
martinzh1 天前
向量化与嵌入模型:RAG系统背后的隐形英雄
人工智能
asdfg12589631 天前
为什么要在出口路由器router配置NAT与默认路由
运维·网络·计算机网络
希赛网1 天前
华为认证HCIA备考知识点 :IP路由基础(含配置案例)
网络·网络协议·计算机网络·路由交换
新智元1 天前
学哲学没出路?不好意思,现在哲学就业碾压 CS!
人工智能·openai
AI码上来1 天前
当小智 AI 遇上数字人,我用 WebRTC 打造实时音视频应用
人工智能·webrtc·实时音视频
一只懒洋洋1 天前
K-meas 聚类、KNN算法、决策树、随机森林
算法·决策树·聚类
黎燃1 天前
智能库存管理的需求预测模型:从业务痛点到落地代码的完整实践
人工智能
机器之心1 天前
DPad: 扩散大语言模型的中庸之道,杜克大学陈怡然团队免训推理加速61倍
人工智能·openai