LoRA: Low-Rank Adaptation of Large Language Models

论文:https://arxiv.org/abs/2106.09685

ABSTRACT

LoRA(Low-Rank Adaptation,低秩自适应)是一种参数高效微调(PEFT)技术。它的核心思想是:冻结预训练大模型的原始权重,只训练少量新增的"旁路"参数,从而以极低的成本实现模型微调。

论文的核心假设是:模型在微调时的权重更新矩阵 ΔW\Delta WΔW 是低秩(Low-Rank)的。这意味着巨大的参数变化实际上可以用极小的"内在维度"来表征。

  • 数学表达 :将全量更新 ΔW\Delta WΔW 分解为两个小矩阵的乘积:
    Wnew=Wold+ΔW=Wold+BAW_{new} = W_{old} + \Delta W = W_{old} + BAWnew=Wold+ΔW=Wold+BA
    其中 B∈Rd×rB \in \mathbb{R}^{d \times r}B∈Rd×r, A∈Rr×kA \in \mathbb{R}^{r \times k}A∈Rr×k,且秩 r≪min⁡(d,k)r \ll \min(d,k)r≪min(d,k)。

Section 4.1 (Method)

理解算法原理的核心

Section 4.2 (Applying to Transformer)

详细说明了 LoRA 应优先应用于 WqW_qWq 和 WvW_vWv 矩阵

Experiments

提供了关于秩(rank)选择、α\alphaα 缩放因子的实证分析。

论文实践-YOLO

1. 数学原理:低秩分解

LoRA 基于一个关键假设:权重更新矩阵是低秩的。这意味着模型在适应新任务时,不需要修改所有参数,只需要一个很小的"增量"。

  • 传统微调 :更新整个权重矩阵 WWW(参数量巨大)。
  • LoRA 微调 :Wnew=Wold+ΔWW_{new} = W_{old} + \Delta WWnew=Wold+ΔW,其中 ΔW\Delta WΔW 被分解为两个小矩阵的乘积:ΔW=A×B\Delta W = A \times BΔW=A×B。
    • A (降维矩阵)和 B(升维矩阵)的秩(rank)远小于原始权重矩阵的维度。
    • 效果 :原本需要训练 m×nm \times nm×n 个参数,现在只需训练 (m+n)×r(m + n) \times r(m+n)×r 个参数(rrr 是极小的秩)。

2. 架构实现:旁路适配

在代码层面,LoRA 不是修改原有层,而是插入新的 Adapter(适配器)

python 复制代码
# 原始前向传播
output = W * x

# 加入 LoRA 后的前向传播
output = W * x + (A * B) * x

关键特性

  • 冻结原权重 :WWW 保持预训练状态,不计算梯度。
  • 仅训练新增参数 :只更新 AAA 和 BBB 的权重。
  • 可合并 :训练完成后,可以将 ΔW\Delta WΔW 合并回 WWW,推理时零开销。

在 Ultralytics 的 YOLO 配置文件中,LoRA 通常通过以下参数控制:

yaml 复制代码
# 启用 LoRA
lora: true

# 关键配置项
lora_rank: 4          # 秩 (r),通常为 4, 8, 16
lora_alpha: 8         # 缩放系数 (alpha)
lora_dropout: 0.05    # 防止过拟合

# 指定应用层(YOLO 特有)
lora_targets: ['model.0.conv', 'model.1.cv2.conv']  # 通常针对卷积层或注意力层
参数 作用 建议值(YOLO)
rank ( r ) 控制适配器的参数量,越大能力越强但越慢 4 / 8 / 16
alpha 控制更新权重的缩放比例 通常设为 rank 的 2 倍
dropout 正则化,防止小数据集过拟合 0.05 - 0.1

对于目标检测任务,LoRA 具有独特的优势:

  1. 任务适配:YOLO 预训练模型(如 COCO)泛化能力已很强,LoRA 只需微调少量参数即可适应特定场景(如医疗影像、工业质检)。
  2. 资源友好:目标检测模型通常较大(如 YOLOv8l、YOLOv9x),全量微调成本极高,LoRA 是性价比最高的方案。
  3. 快速迭代:允许在单张消费级 GPU 上快速实验多个微调任务。
相关推荐
电子科技圈1 小时前
SmartDV展示完整的边缘与连接IP解决方案,以高速和低功耗特性赋能移动、物联网和媒体处理设备创新
人工智能·嵌入式硬件·mcu·物联网·智能家居·智能硬件·iot
Rubin智造社2 小时前
04月17日AI每日参考:Claude Opus 4.7正式发布,智元机器人大会今日开幕
大数据·人工智能·机器学习·claude code·智元机器人·deepseek v4·claude opus 4.7
Raink老师9 小时前
【AI面试临阵磨枪】详细解释 Transformer 架构的核心组件与工作流程。
人工智能·深度学习·transformer·ai 面试·ai 应用开发
qcx239 小时前
【AI Agent实战】OpenClaw 安全加固完全指南:安全攻击手段与五步防护实践(2026最新)
人工智能·安全
码农小白AI9 小时前
AI报告审核进入技术驱动时代:IACheck如何从规则引擎走向深度学习,构建检测报告审核“技术矩阵”
人工智能·深度学习
song150265372989 小时前
视觉检测设备:自动识别缺陷、尺寸、瑕疵、装配错误,一键全检
人工智能·计算机视觉·视觉检测
智能化咨询9 小时前
(163页PPT)某著名企业K3生产制造售前营销指导方案P164(附下载方式)
大数据·人工智能
Zzj_tju10 小时前
大语言模型技术指南:SFT、RLHF、DPO 怎么串起来?对齐训练与关键参数详解
人工智能·深度学习·语言模型
金智维科技官方10 小时前
RPA技术赋能电信运营商话单稽核:金智维如何驱动高精度自动化转型
人工智能·自动化·数字化·rpa·智能体·电信
2501_9481142410 小时前
2026模型能力分化加剧:多模型聚合架构的技术解析与工程落地思考
人工智能·ai·chatgpt·架构