机器学习三十六

摘要

本周学习了Life-Long Learning的相关知识,重点了解了灾难性遗忘与灾难性遗忘的出现原因以及解决方法Selective Synaptic Plasticity的基本理论与公式

Abstract

This week, I learned about concepts related to Life-Long Learning, with a focus on catastrophic forgetting, the reasons for its occurrence, and the basic theory and formulas of Selective Synaptic Plasticity, a method to address it.

Life-Long Learning"(终身学习),就是让机器学习模型能够持续不断地学习新任务,同时不忘记已经学过的旧知识。

  1. 持续学习:不像传统模型训练完一个任务就固定不变,终身学习的模型会不断接收新数据、新任务。

  2. 知识积累:它要在学习新东西时,利用或保留过去学到的有用知识,实现正向迁移。

  3. 克服灾难性遗忘:这是最大的挑战。普通模型学新任务后,往往会彻底忘记旧任务(称为"灾难性遗忘")。终身学习的目标就是在学习新知识时,不严重破坏旧知识。

其中灾难性遗忘是指人工神经网络在连续学习多个任务时的一个关键缺陷:当模型学习新任务并调整自身参数以优化新任务的性能后,它会急剧且彻底地丧失先前学习任务的执行能力。这并非缓慢的遗忘,而是一种突发性的崩塌------原本在旧任务上表现优异的网络,其准确率可能从很高水平瞬间跌至随机猜测的程度。如下图所示,在先学习任务一再任务二的的情况下,任务一的结果表现得很差。但是同时学习任务一与任务二时,机器又能同时得到不错的结果。这证明并不是机器没有能力学习多个任务,而是存在某些原因导致灾难性遗忘的发生

Selective Synaptic Plasticity 为解决神经网络的灾难性遗忘(Catastrophic Forgetting)问题提出的核心思路之一,其基本假设是:模型中的参数并非对所有任务同等重要,部分参数是旧任务的 "关键记忆载体",如果这些参数在学习新任务时被大幅修改,模型就会彻底遗忘旧任务;而另一部分参数对旧任务的影响微乎其微,完全可以用来适配新任务。因此,该方法的核心策略就是"选择性保护重要参数,只允许更新对旧任务不重要的参数",在学习新知识的同时尽可能保留旧知识。

公式中也体现了两种极端情况:当 bi​=0 时,该参数不受任何约束,模型可以随意修改它,如果大量关键参数的 bi​ 都为 0,就会直接导致灾难性遗忘;当 bi​=∞ 时,该参数会被完全锁定在旧任务的状态,模型无法更新它,最终陷入无法学习新任务的 "僵化(Intransigence)" 状态。这一框架也正是 EWC(弹性权重巩固)、Synaptic Intelligence(突触智能)等经典持续学习算法的底层逻辑 ------ 它们的核心差异仅在于计算 "重要性权重 bi​" 的方式不同,EWC 使用费雪信息矩阵估计参数重要性,Synaptic Intelligence 则通过跟踪参数对损失的贡献来计算重要性,但其本质都是通过选择性地约束参数更新,在持续学习中平衡记忆与可塑性。

相关推荐
Litluecat几秒前
配合多角色提示语3,学习AI漫剧(刚开始学)
人工智能·学习·ai·提示词·短剧·漫剧
xixingzhe23 分钟前
AI开发工具-大需求
人工智能
沪漂阿龙11 分钟前
create_agent:LangChain 新版 Agent 的核心入口
人工智能·架构·langchain
茉莉玫瑰花茶12 分钟前
综合案例 - AI 智能租房助手 [ 5 ]
服务器·数据库·人工智能·python·ai
文艺倾年19 分钟前
【强化学习】强化学习基本概念,20W字总结(一)
人工智能·python·语言模型·自然语言处理·面试·职场和发展·大模型
FserSuN20 分钟前
压缩在智能中的作用
人工智能
产业家21 分钟前
AI长跑,来到了腾讯的主场
大数据·人工智能
MartinYeung525 分钟前
[论文学习]大型语言模型中个人可识别资讯(PII)的机器遗忘技术:UnlearnPII 基准与 PERMU_tok 方法的深度分析
人工智能·学习·语言模型
孟郎郎25 分钟前
2026 年 15 款 AI 视频生成工具推荐
人工智能·ai·工具·ai视频
器灵科技25 分钟前
AI视频工具实测:Seedance/可灵/HappyHorse谁最能打?
java·运维·数据库·人工智能·github