论文略读:LoRA Learns Less and Forgets Less

202405 arxiv

1 主要思想

LORA相比于全参数训练,学的少,但忘的也少

2 实验分析

2.1 训练的表现

  • 在编程和数学任务中,LoRA相比全参数微调表现出明显的劣势

2.2 遗忘的表现

  • 这边的遗忘,是指在数据集A上预训练,然后在数据集B上继续finetune,看在数据集A上的表现
  • 相比全参数微调,LoRA学会的东西较少,但遗忘也相对更少

3 论文的分析:Lora的正则化特性

  • LoRA提供了比经典正则化技术,如权重衰减和dropout,更强的正则化效果。
  • 在下游任务上LoRA的表现低于大多数正则化方法(左图);在遗忘上LoRA优于所有正则化方法(右图)
相关推荐
lihuhelihu21 分钟前
第T4周:猴痘病识别
图像处理·深度学习·神经网络·计算机视觉·分类·tensorflow·keras
瞻邈28 分钟前
DreamCar运行笔记
pytorch·笔记·深度学习
AI合规备案中心30 分钟前
算法备案和大模型备案的这些区别 你知道吗?
人工智能·aigc·大模型备案·算法备案·算法备案代办
sml_54211 小时前
朴素贝叶斯分类算法
人工智能·机器学习·分类
听风吹等浪起1 小时前
SAM 提示框和 Unet的语义分割的融合:自动驾驶车道线分割
人工智能·机器学习·自动驾驶·语义分割
茴香豆的茴11 小时前
如何在D盘创建虚拟环境?包括安装PyTorch和配置PyCharm
人工智能·pytorch·pycharm
CV-King1 小时前
从零开始学cv-10:形态学变换(一)
图像处理·人工智能·python·opencv·算法·机器学习·计算机视觉
FL16238631291 小时前
[数据集][目标检测]街道乱放广告牌检测数据集VOC+YOLO格式114张1类别
人工智能·yolo·目标检测
子午1 小时前
马铃薯叶片病害识别系统+Python+图像识别+人工智能+深度学习+卷积神经算法+计算机课设项目
人工智能·python·深度学习
有Li1 小时前
CCSI: 用于无数据类别增量学习的持续类别特定印象|文献速递--基于深度学习的医学影像病灶分割
人工智能·深度学习·学习