2023-ICLR-Adaptive Budget Allocation for Parameter-Efficient Fine-Tuning

2023-ICLR-Adaptive Budget Allocation for Parameter-Efficient Fine-Tuning

Paper:https://openreview.net/forum?id=lq62uWRJjiY

Code:https://github.com/QingruZhang/AdaLoRA

自适应计算分配,实现参数高效微调

为了实现动态地调节Lora的rank的大小,首先将Lora改写为SVD的形式。这是对LoRA的一种改进,它根据重要性评分动态分配参数预算给权重矩阵。

调整增量矩分配。AdaLoRA将关键的增量矩阵分配高秩以捕捉更精细和任务特定的信息,而将较不重要的矩阵的秩降低,以防止过拟合并节省计算预算。

以奇异值分解的形式对增量更新进行参数化,并根据重要性指标裁剪掉不重要的奇异值,同时保留奇异向量。由于对一个大矩阵进行精确SVD分解的计算消耗非常大,这种方法通过减少它们的参数预算来加速计算,同时,保留未来恢复的可能性并稳定训练。

W = W ( 0 ) + Δ = W ( 0 ) + P Λ Q W=W^{(0)}+\Delta=W^{(0)}+P \Lambda Q W=W(0)+Δ=W(0)+PΛQ

在训练损失中添加了额外的惩罚项,以规范奇异矩阵P和Q的正交性,从而避免SVD的大量计算并稳定训练。

相关推荐
zy_destiny6 分钟前
【YOLOv12改进trick】三重注意力TripletAttention引入YOLOv12中,实现遮挡目标检测涨点,含创新点Python代码,方便发论文
网络·人工智能·python·深度学习·yolo·计算机视觉·三重注意力
自由的晚风8 分钟前
深度学习在SSVEP信号分类中的应用分析
人工智能·深度学习·分类
胡耀超1 小时前
5.训练策略:优化深度学习训练过程的实践指南——大模型开发深度学习理论基础
人工智能·python·深度学习·大模型
潘达斯奈基~2 小时前
机器学习4-PCA降维
人工智能·深度学习·机器学习
国家级退堂鼓9 小时前
YOLOv8改进SPFF-LSKA大核可分离核注意力机制
人工智能·python·深度学习·yolo·目标检测·yolov8
arbboter14 小时前
【AI深度学习基础】Pandas完全指南进阶篇:解锁高效数据处理高阶技能 (含完整代码)
人工智能·深度学习·pandas高级技巧·数据处理性能优化·pandas机器学习整合·时间序列分析实战·数据清洗正则表达式
zxfeng~14 小时前
深度学习之-“深入理解梯度下降”
人工智能·python·深度学习·神经网络
美狐美颜sdk15 小时前
美颜SDK架构揭秘:人脸美型API的底层实现与优化策略
图像处理·人工智能·深度学习·架构·视频美颜sdk·美颜api
惊雲浅谈天15 小时前
Self-Supervised Prompt Optimization
人工智能·prompt
阿正的梦工坊16 小时前
变分扩散模型 ELBO 重构推导详解
人工智能·深度学习·算法·机器学习