迁移学习的基本方法——基于样本、特征、模型、关系的迁移

Hi,大家好,我是半亩花海。在上节说明了迁移学习领域的其他度量准则(KL散度与JS距离、MMD、PA、A-distance、HSIC)之后,本文主要将介绍迁移学习的四种基本方法------基于样本 迁移、基于特征 迁移、基于模型 迁移、基于关系 迁移。其中,基于样本迁移通过调整源域样本权重实现迁移;基于特征迁移通过特征变换减少域间差异,是目前研究热点;基于模型迁移寻找共享参数,多与深度神经网络结合;基于关系迁移关注样本间关系,但相关研究较少。文章重点分析了基于特征和模型的方法,指出它们是目前迁移学习领域的主要研究方向。


目录

一、基于样本迁移

二、基于特征迁移

三、基于模型迁移

四、基于关系迁移


基于样本的迁移学习方法示意图

按照迁移学习领域权威综述文章 A survey on transfer learning [Pan and Yang, 2010], 迁移学习的基本方法可以分为四种。这四种基本的方法分别是:基于样本的迁移,基于模型的迁移,基于特征的迁移,及基于关系的迁移。本部分简要叙述各种方法的基本原理和代表性相关工作。基于特征和模型的迁移方法是我们的重点

一、基于样本迁移

基于样本的迁移学习方法 (Instance based Transfer Learning) 根据一定的权重生成规则,对数据样本进行重用,来进行迁移学习。图14形象地表示了基于样本迁移方法的思想。 源域中存在不同种类的动物,如狗、鸟、猫等,目标域只有狗这一种类别。在迁移时,为了最大限度地和目标域相似,我们可以人为地提高源域中属于狗这个类别的样本权重。


二、基于特征迁移

基于特征的迁移方法 (Feature based Transfer Learning) 是指将通过特征变换的方式互相迁移 [Liu et al., 2011, Zheng et al., 2008, Hu and Yang, 2011],来减少源域和目标域之间的差距;或者将源域和目标域的数据特征变换到统一特征空间中 [Pan et al., 2011, Long et al., 2014b, Duan et al., 2012],然后利用传统的机器学习方法进行分类识别。根据特征的同构和异构性,又可以分为同构和异构迁移学习。图15很形象地表示了两种基于特征的迁移学习方法。
基于特征的迁移学习方法示意图

++基于特征的迁移学习方法是迁移学习领域中最热门的研究方法++,这类方法通常假设源域和目标域间有一些交叉的特征。近年来,基于特征的迁移学习方法大多与神经网络进行结合,在神经网络的训练中进行学习特征和模型的迁移。


三、基于模型迁移

基于模型的迁移方法 (Parameter/Model based Transfer Learning) 是指从源域和目标域中找到他们之间共享的参数信息,以实现迁移的方法。这种迁移方式要求的假设条件是:源域中的数据与目标域中的数据可以共享一些模型的参数。下图形象地表示了基于模型的迁移学习方法的基本思想。
基于模型的迁移学习方法示意图

通过对现有工作的调研可以发现,目前绝大多数基于模型的迁移学习方法都与深度神经网络进行结合。这些方法对现有的一些神经网络结构进行修改,在网络中加入领域适配层,然后联合进行训练。因此,++这些方法也可以看作是基于模型、特征的方法的结合++。


四、基于关系迁移

基于关系的迁移学习方法 (Relation Based Transfer Learning) 与上述三种方法具有截 然不同的思路。这种方法比较关注源域和目标域的样本之间的关系。下图形象地表示了不同领域之间相似的关系
基于关系的迁移学习方法示意图

就目前来说,基于关系的迁移学习方法的相关研究工作非常少,仅有几篇连贯式的文章讨论:[Mihalkova et al., 2007, Mihalkova and Mooney, 2008, Davis and Domingos, 2009]。这些文章都借助于马尔科夫逻辑网络 (Markov Logic Net) 来挖掘不同领域之间的关系相似性。
基于马尔科夫逻辑网的关系迁移标题

在后面的文章中,我们将重点讨论基于特征和基于模型的迁移学习方法,这也是目前绝大多数研究工作的热点。


五、参考资料

1. 王晋东《迁移学习简明手册》(PDF版) https://www.labxing.com/files/lab_publications/615-1533737180-LiEa0mQe.pdf#page=82&zoom=100,120,392

2. 《迁移学习简明手册》发布啦! https://zhuanlan.zhihu.com/p/35352154

相关推荐
小途软件1 分钟前
基于深度学习的垃圾识别分类研究与实现
人工智能·pytorch·python·深度学习·语言模型
DisonTangor2 分钟前
UltraShape 1.0: 高保真三维形状生成:基于可扩展几何优化
人工智能·3d·开源·aigc
Salt_07283 分钟前
DAY 58 经典时序预测模型 1
人工智能·python·深度学习·神经网络·机器学习
乾元3 分钟前
企业无线的 AI 频谱与功率自动优化——从人工勘测到“可学习的无线网络”(含真实室内工程案例)
服务器·网络·人工智能·网络协议·安全·信息与通信
数说星榆1819 分钟前
农业智能化:作物识别与生长模拟
人工智能
Warren2Lynch25 分钟前
如何使用Visual Paradigm AI Chatbot创建3D打印机UML状态机图:综合指南
人工智能·uml
小途软件29 分钟前
基于深度学习的人脸属性增强器
java·人工智能·pytorch·python·深度学习·语言模型
学长讲AI33 分钟前
开题报告PPT一键生成
人工智能·powerpoint
audyxiao00134 分钟前
自动驾驶论文分享|TrajVAE:无需强约束即可灵活生成高质量行车轨迹
人工智能·机器学习·自动驾驶·neurocomputing
Hcoco_me39 分钟前
大模型面试题46:在训练7B LLM时,如果使用AdamW优化器,那么它需要的峰值显存是多少?
开发语言·人工智能·深度学习·transformer·word2vec