Lora训练

一种大模型高效训练方式(PEFT)

目标:

训练有限的ΔW(权重更新矩阵)

ΔW为低秩矩阵→ΔW=AB(其中A的大小为d r, B的大小为rk,且r<<min(d,k))→ 原本要更新的dk参数量大幅度缩减成r*(d+k),训练更高效

问题:

1、矩阵的秩(rank)是什么?

矩阵行向量或列向量的极大线性无关组的向量个数,等价于:

矩阵中非零奇异值的个数。
矩阵线性变换后空间的维度(像空间的维数)。
2、为什么ΔW为低秩矩阵?

微调只需要调整少数方向
3、为什么r<<min(d,k)?

奇异值分解可以解释。

相关推荐
倔强青铜三几秒前
苦练Python第8天:while 循环之妙用
人工智能·python·面试
凤年徐1 分钟前
【数据结构与算法】203.移除链表元素(LeetCode)图文详解
c语言·开发语言·数据结构·算法·leetcode·链表·刷题
NAGNIP1 分钟前
大模型幻觉:你信它,它却在胡说?
算法·设计
_一条咸鱼_6 分钟前
LangChain输出解析器的作用与类型解析(17)
人工智能·面试·langchain
Shilong Wang16 分钟前
动态物体滤除算法
算法·机器学习·计算机视觉
2401_8786247916 分钟前
pytorch 神经网络
人工智能·pytorch·神经网络
一点一木17 分钟前
🚀 2025 年 06 月 GitHub 十大热门项目排行榜 🔥
前端·人工智能·github
蓑雨春归19 分钟前
多代理系统(multi-agent)框架深度解析:架构、特性与未来
人工智能·大模型·agent
学废了wuwu22 分钟前
深度学习归一化方法维度参数详解(C/H/W/D完全解析)
c语言·人工智能·深度学习
whabc10022 分钟前
和鲸社区深度学习基础训练营2025年关卡4
人工智能·深度学习