Life long learning

现象:一个model进行multi-task learning做的还可以,说明模型是可以同时学会多个任务的,但是如果训练过程是1个task 1个task的顺序进行,模型就会发生灾难性的遗忘现象,只会做刚学完的task。

目标:让模型不要那么快忘掉过去学到的东西

upper bound:multi-task learning,能不忘并达到multi-task learning水平就是很厉害了。

方法一:Selective Synaptic Plasticity

在下一个task训练的时候要让模型尽可能少的调整对上一个task重要的parameter

参数bi衡量参数对上一个任务的重要性,可以通过调整一下θbi看看上一个task的loss变化大还是小来确定(bi是超参数,人为预先设定,task2 train的时候是不变的)

方法二:Gradient Episodic Memory (GEM)

保存上一个task的少量训练资料,以在新的task每次调整梯度的时候都可以回头算一下上一个task此时的梯度,然后将新旧梯度结合(新梯度为主,这种方法有点像作弊,直接就在进行multi-task learning了,但是区别是它只用上一个task一点点资料来计算个梯度)

相关推荐
熊猫钓鱼>_>16 小时前
MinerU的正确使用方式:如何解析PDF成标准化向量数据,以供AI大模型等场景应用
人工智能·阿里云·架构·pdf·ocr·skill·mineru
minhuan16 小时前
大模型应用:医疗AI智能体的容错设计:化解医疗场景模糊、错误的不确定性.126
人工智能·大模型应用·智能体容错设计·ai的人性关怀
happyprince16 小时前
2026年03月27日全球AI前沿动态
人工智能
财迅通Ai16 小时前
探路者跨界芯片布局遇AI内存革命 卡位“后TurboQuant时代”
人工智能·探路者
code_pgf16 小时前
Jetson Orin NX 16GB 的推荐传感器组合 + 资源预算 + 软件栈安装顺序(humble)
人工智能·数码相机
源码学社16 小时前
[特殊字符] 字节跳动开源 DeerFlow:一个“深度研究型 AI Agent 框架”详解
人工智能
AINative软件工程16 小时前
Structured Outputs 实战:让大模型稳定输出 JSON 的三种方案对比
人工智能
材料科学研究16 小时前
深度学习实战:5天掌握神经网络与PINN
深度学习·神经网络·pinn
Entropy-Go16 小时前
一图了解AI热门词汇 - OpenClaw/Prompt/Agent/Skill/MCP/LLM/GPU
人工智能·agent·skill·mcp·openclaw
惠惠软件16 小时前
AI 龙虾 | 对学习工作的影响和未来前瞻
人工智能·学习