Life long learning

现象:一个model进行multi-task learning做的还可以,说明模型是可以同时学会多个任务的,但是如果训练过程是1个task 1个task的顺序进行,模型就会发生灾难性的遗忘现象,只会做刚学完的task。

目标:让模型不要那么快忘掉过去学到的东西

upper bound:multi-task learning,能不忘并达到multi-task learning水平就是很厉害了。

方法一:Selective Synaptic Plasticity

在下一个task训练的时候要让模型尽可能少的调整对上一个task重要的parameter

参数bi衡量参数对上一个任务的重要性,可以通过调整一下θbi看看上一个task的loss变化大还是小来确定(bi是超参数,人为预先设定,task2 train的时候是不变的)

方法二:Gradient Episodic Memory (GEM)

保存上一个task的少量训练资料,以在新的task每次调整梯度的时候都可以回头算一下上一个task此时的梯度,然后将新旧梯度结合(新梯度为主,这种方法有点像作弊,直接就在进行multi-task learning了,但是区别是它只用上一个task一点点资料来计算个梯度)

相关推荐
Aaron1588几秒前
RFSOC+VU13P/VU9P+GPU多通道同步一体化解决方案
人工智能·嵌入式硬件·算法·matlab·fpga开发·硬件架构·基带工程
用户465853297072 分钟前
RAG 检索增强系统:从原理到实战的完整指南
人工智能
GIOTTO情5 分钟前
Infoseek舆情处置技术解析:基于AI大模型的全链路自动化处置方案
运维·人工智能·自动化
是2的10次方啊5 分钟前
OpenClaw 实测:从聊天工具到可执行 AI Agent
人工智能
情绪总是阴雨天~7 分钟前
大模型 Function Call(函数调用)详解:原理、实践与数据库智能查询 Agent
前端·数据库·人工智能
张二娃同学7 分钟前
第12篇_深度学习学习路线总结
人工智能·python·深度学习·神经网络·学习
Ting-yu19 分钟前
Spring AI Alibaba零基础速成(1) ---- 项目创建与配置
java·人工智能·spring
松果财经20 分钟前
灵尾科技拿下四场全球大展,开拓爬宠市场新蓝海
人工智能·科技
喜欢coding的谢同学20 分钟前
ArthasClaw:用自然语言诊断 JVM 的 AI 助手,告别繁琐的 Arthas 命令
java·人工智能·arthas
淡海水21 分钟前
ComfyUI全面掌握-知识点详解——基础示例:文生图与图生图实操(参数+案例)
大数据·人工智能·算法·comfyui