2023-ICLR-Adaptive Budget Allocation for Parameter-Efficient Fine-Tuning

2023-ICLR-Adaptive Budget Allocation for Parameter-Efficient Fine-Tuning

Paper:https://openreview.net/forum?id=lq62uWRJjiY

Code:https://github.com/QingruZhang/AdaLoRA

自适应计算分配,实现参数高效微调

为了实现动态地调节Lora的rank的大小,首先将Lora改写为SVD的形式。这是对LoRA的一种改进,它根据重要性评分动态分配参数预算给权重矩阵。

调整增量矩分配。AdaLoRA将关键的增量矩阵分配高秩以捕捉更精细和任务特定的信息,而将较不重要的矩阵的秩降低,以防止过拟合并节省计算预算。

以奇异值分解的形式对增量更新进行参数化,并根据重要性指标裁剪掉不重要的奇异值,同时保留奇异向量。由于对一个大矩阵进行精确SVD分解的计算消耗非常大,这种方法通过减少它们的参数预算来加速计算,同时,保留未来恢复的可能性并稳定训练。

W = W ( 0 ) + Δ = W ( 0 ) + P Λ Q W=W^{(0)}+\Delta=W^{(0)}+P \Lambda Q W=W(0)+Δ=W(0)+PΛQ

在训练损失中添加了额外的惩罚项,以规范奇异矩阵P和Q的正交性,从而避免SVD的大量计算并稳定训练。

相关推荐
糖葫芦君16 小时前
基于树结构突破大模型自身能力
人工智能·深度学习·大模型
化作星辰16 小时前
深度学习_原理和进阶_PyTorch入门(2)后续语法2
pytorch·深度学习·学习
小白狮ww16 小时前
VASP 教程:使用 VASP 进行机器学习力场训练
人工智能·深度学习·机器学习·大模型·分子动力学·计算机程序·vasp
serve the people17 小时前
Prompt Composition with LangChain’s PipelinePromptTemplate
java·langchain·prompt
喜欢吃豆17 小时前
从入门到精通:OpenAI Prompt Engineering 与 Prompt Caching 实战详解
prompt
摘星观月19 小时前
【深度学习5】多层感知机
人工智能·深度学习
Blossom.11819 小时前
把AI“贴”进路灯柱:1KB决策树让老旧路灯自己报「灯头松动」
java·人工智能·python·深度学习·算法·决策树·机器学习
qzhqbb19 小时前
神经网络—— 人工神经网络导论
人工智能·深度学习·神经网络
极客BIM工作室19 小时前
ControlNet:Adding Conditional Control to Text-to-Image Diffusion Models
人工智能·深度学习·机器学习
现在,此刻20 小时前
李沐深度学习笔记D1-什么是深度学习
人工智能·笔记·深度学习