多模态学习

gz7seven9 天前
大模型·多模态·blip·多模态学习·多模态大模型·图文生成
大模型学习笔记------BLIP模型详解与思考在上两篇文章中讲到了CLIP模型的主要应用与一些思考,本文的BLIP模型对CLIP模型的一个增强版本,能够更好地处理复杂的视觉和语言结合的任务,推动了多模态学习的发展。我认为比较重要的不同主要体现在如下两个方面:
xwz小王子9 个月前
人工智能·学习·机器人·多模态学习
通过视触觉多模态学习实现机器人泛化操作这篇文章的主题是探讨如何通过融合视觉和触觉信息来提高强化学习的效率和泛化能力。作者提出了一种名为Masked Multimodal Learning(M3L)的新型学习策略。M3L的核心思想是在策略梯度更新和基于掩蔽自编码的表示学习阶段之间交替进行。
TechBeat人工智能社区1 年前
机器学习·计算机视觉·多模态学习·neurlps·自监督训练
NeurIPS 2023 | 对比损失深度刨析!三星研究院提出全新连续性对比损失CMCL论文名称: CWCL: Cross-Modal Transfer with Continuously Weighted Contrastive Loss 论文链接: https://arxiv.org/abs/2309.14580
风終會離開1 年前
多模态学习
MFAN论文阅读笔记(待复现)论文标题:MFAN: Multi-modal Feature-enhanced Attention Networks for Rumor Detection 论文作者:Jiaqi Zheng, Xi Zhang, Sanchuan Guo, Quan Wang, Wenyu Zang, Yongdong Zhang 论文来源:IJCAI 2022 代码来源:Code