Lora训练

辉辉还没睡2025-06-21 20:53

一种大模型高效训练方式（PEFT）

目标：

训练有限的ΔW（权重更新矩阵）

ΔW为低秩矩阵→ΔW=AB（其中A的大小为d r, B的大小为rk，且r<<min(d,k)）→ 原本要更新的dk参数量大幅度缩减成r*(d+k)，训练更高效

问题：

1、矩阵的秩（rank）是什么？

矩阵行向量或列向量的极大线性无关组的向量个数，等价于：

矩阵中非零奇异值的个数。
矩阵线性变换后空间的维度（像空间的维数）。
2、为什么ΔW为低秩矩阵？

微调只需要调整少数方向
3、为什么r<<min(d,k)？

奇异值分解可以解释。

上一篇：LVS vs Nginx 负载均衡对比：全面解析

下一篇：西门子S7通信协议抓包分析应用

热门推荐

01如何新建文件夹？电脑新建文件夹的4种方法 02GitHub 镜像站点 03国内可直接用、免费额度/永久免费的大模型API清单（含 SiliconFlow、火山、阿里、智谱、百度、Kimi、DeepSeek、DMXAPI 等）042026年7月AI圈大地震：GPT-5.6被政府限制、Claude入驻Slack、Anthropic自研芯片 05微信历史版本含下载地址（ Windows PC | 安卓 | MAC ）及设置微信不更新 06AI 编程 IDE 全景解析 2026：Agent 全面接管开发链路 072026 国产 AI 大模型横评：DeepSeek、通义千问、Kimi、文心一言、星火、豆包谁更能打？08AI科技热点日报 | 2026年07月01日 09Agnes AI 免费 API 接入指南：文本、生图、生视频，一套接口全免费 102026 年 AI 大模型 & AI 编程工具实战全总结