2023-ICLR-Adaptive Budget Allocation for Parameter-Efficient Fine-Tuning

2023-ICLR-Adaptive Budget Allocation for Parameter-Efficient Fine-Tuning

Paper:https://openreview.net/forum?id=lq62uWRJjiY

Code:https://github.com/QingruZhang/AdaLoRA

自适应计算分配,实现参数高效微调

为了实现动态地调节Lora的rank的大小,首先将Lora改写为SVD的形式。这是对LoRA的一种改进,它根据重要性评分动态分配参数预算给权重矩阵。

调整增量矩分配。AdaLoRA将关键的增量矩阵分配高秩以捕捉更精细和任务特定的信息,而将较不重要的矩阵的秩降低,以防止过拟合并节省计算预算。

以奇异值分解的形式对增量更新进行参数化,并根据重要性指标裁剪掉不重要的奇异值,同时保留奇异向量。由于对一个大矩阵进行精确SVD分解的计算消耗非常大,这种方法通过减少它们的参数预算来加速计算,同时,保留未来恢复的可能性并稳定训练。

W = W ( 0 ) + Δ = W ( 0 ) + P Λ Q W=W^{(0)}+\Delta=W^{(0)}+P \Lambda Q W=W(0)+Δ=W(0)+PΛQ

在训练损失中添加了额外的惩罚项,以规范奇异矩阵P和Q的正交性,从而避免SVD的大量计算并稳定训练。

相关推荐
测绘第一深情13 小时前
AutoDL 上复现 MapQR:从环境配置到 nuScenes Mini 训练跑通
人工智能·深度学习·机器学习·自动驾驶·transformer
王_teacher13 小时前
RNN 反向传播数学推导(BPTT 时间反向传播)
人工智能·rnn·深度学习
renhongxia113 小时前
开源大模型VS闭源大模型:2026年格局再梳理
深度学习·算法·语言模型·分类·开源
贵州晓智信息科技14 小时前
学词鸭 Typing 无痛背单词
人工智能·pytorch·python·深度学习
断眉的派大星14 小时前
深度学习——优化器终极指南
人工智能·深度学习
2zcode14 小时前
基于深度学习的泳池溺水行为检测系统设计与实现
人工智能·深度学习
佳xuan14 小时前
深度学习pytorch
人工智能·pytorch·深度学习
茗创科技14 小时前
IEEE子刊|利用最优数量EEG电极实时检测认知负荷的深度学习技术
深度学习·机器学习·matlab·脑网络
小何code14 小时前
【第19篇】卷积神经网络CNN入门:图像识别的利器
人工智能·深度学习·cnn
古希腊掌管代码的神THU14 小时前
【清华代码熊】多模态|智谱GLM-5V-Turbo技术报告解析
人工智能·深度学习·自然语言处理