【论文阅读】多任务学习起源类论文《Multi-Task Feature Learning》

多任务特征学习

前言

该论文提出了一种通过低纬度表征多任务共性 的方法.通过建立一个1维范式问题将多任务共同学习特征数进行正则化.这个问题等价于一个凸优化问题,用迭代算法进行求解.整个算法可以理解为非监督模块与监督模块,前者学习多任务的共同表征,后者使用该表征学习每个任务的目标.

论文获取

作者:Andreas Argyriou, Theodoros Evgeniou, Massimiliano Pontil

会议/期刊:Advances in Neural Information Processing Systems (NeurIPS), 2007

1、背景假设

定义特征维度为d,任务数为T, a i t a_{it} ait是第i个特征对任务t的回归参数,假设任务与特征之间的回归参数少许为0 ,也就是说特征维度里大多数与大部分任务都有关.

假设共享特征均为线性

,扩展为非线性可以表示为

,这样多任务的非线性特征W=U A,A为参数 a i t a_{it} ait的矩阵,我们知道a有些许为0,这意味着A有些行为0,W为低秩矩阵.

2、一范式问题

我们目标是求解共享特征u与回归参数a,首先固定u与任务t,可以得到其优化目标函数如下所示,因为问题较难求解,所以增加了a的一范式 .

扩展到全部任务上得到

3、凸优函数

求解上式子是一项具有挑战性的任务,尽管在变量A和U中分别是凸的,整体上这是一个非凸问题。其次,范数不光滑,这使得求解变得更加困难。通过变换,得到下式子是一个凸函数问题(比较老的论文,证明不再展开)

这样,固定D,我们可以通过svm,或者回归类的方法求取w,然后再更新D,如此循环直到收敛,其具体求解过程如下所示:初始化D,W,输入x,y,遍历任务求取w,更新D(更新值的方式是通过低秩矩阵分解得到 ),然后重复求取w过程,直到满足收敛条件.

4、实验

这里主要注意一下实验所用的数据是180个人对20电脑品牌的倾向性,这个数据放到现在来说不算严格的多任务学习了,现在的多任务学习里任务间的差异会更大,比如同时预测销售额与销售量.因此不再展开讨论实验结果.值得注意的是该论文启发了许多基于稀疏性和低秩约束的后续研究.

相关推荐
西岸行者5 天前
学习笔记:SKILLS 能帮助更好的vibe coding
笔记·学习
悠哉悠哉愿意5 天前
【单片机学习笔记】串口、超声波、NE555的同时使用
笔记·单片机·学习
别催小唐敲代码5 天前
嵌入式学习路线
学习
毛小茛5 天前
计算机系统概论——校验码
学习
babe小鑫5 天前
大专经济信息管理专业学习数据分析的必要性
学习·数据挖掘·数据分析
winfreedoms5 天前
ROS2知识大白话
笔记·学习·ros2
在这habit之下5 天前
Linux Virtual Server(LVS)学习总结
linux·学习·lvs
我想我不够好。5 天前
2026.2.25监控学习
学习
im_AMBER5 天前
Leetcode 127 删除有序数组中的重复项 | 删除有序数组中的重复项 II
数据结构·学习·算法·leetcode
CodeJourney_J5 天前
从“Hello World“ 开始 C++
c语言·c++·学习