2023-ICLR-Adaptive Budget Allocation for Parameter-Efficient Fine-Tuning

2023-ICLR-Adaptive Budget Allocation for Parameter-Efficient Fine-Tuning

Paper:https://openreview.net/forum?id=lq62uWRJjiY

Code:https://github.com/QingruZhang/AdaLoRA

自适应计算分配,实现参数高效微调

为了实现动态地调节Lora的rank的大小,首先将Lora改写为SVD的形式。这是对LoRA的一种改进,它根据重要性评分动态分配参数预算给权重矩阵。

调整增量矩分配。AdaLoRA将关键的增量矩阵分配高秩以捕捉更精细和任务特定的信息,而将较不重要的矩阵的秩降低,以防止过拟合并节省计算预算。

以奇异值分解的形式对增量更新进行参数化,并根据重要性指标裁剪掉不重要的奇异值,同时保留奇异向量。由于对一个大矩阵进行精确SVD分解的计算消耗非常大,这种方法通过减少它们的参数预算来加速计算,同时,保留未来恢复的可能性并稳定训练。

W = W ( 0 ) + Δ = W ( 0 ) + P Λ Q W=W^{(0)}+\Delta=W^{(0)}+P \Lambda Q W=W(0)+Δ=W(0)+PΛQ

在训练损失中添加了额外的惩罚项,以规范奇异矩阵P和Q的正交性,从而避免SVD的大量计算并稳定训练。

相关推荐
AI算法沐枫6 小时前
机器学习到底是什么?
人工智能·python·深度学习·机器学习·数据挖掘·大模型·#ai
编码时空的诗意行者10 小时前
那些全新的Prompt范式(新提示词工程新思维)
人工智能·prompt·ai编程
AI医影跨模态组学10 小时前
如何将影像组学与病理组学特征与胃癌术后复发的“炎症‑耗竭”免疫机制建立关联,并解释其与患者预后及辅助化疗/免疫治疗响应的机制联系
人工智能·深度学习·论文·医学影像·影像组学
动物园猫11 小时前
三类公路裂缝目标检测数据集分享(适用于YOLO系列深度学习检测任务)
深度学习·yolo·目标检测
索木木11 小时前
Deepseek MLA CP通信AlltoAll
人工智能·深度学习·训练·模型并行·cp并行·alltoall
YUDAMENGNIUBI12 小时前
day31_RNN及其变体
人工智能·rnn·深度学习
大模型最新论文速读13 小时前
GRPO 丢失的组内排序信息,LamPO 补回来了
论文阅读·人工智能·深度学习·机器学习·自然语言处理
云 祁13 小时前
从 Prompt 到 Skills:AI 能力工程化的范式跃迁
prompt
AI医影跨模态组学13 小时前
如何将多参数MRI影像组学特征与CMS4相关TGF-β/EMT/CAF机制建立关联,并进一步解释其与患者预后及治疗响应的机制联系
人工智能·深度学习·论文·医学影像·影像组学
南汁bbj14 小时前
从Prompt到Agent:教育错题分析系统的流程编排设计实践
人工智能·prompt