书生·浦语大模型实战营-学习笔记4

XTuner 大模型单卡低成本微调实战

Finetune简介

常见的两种微调策略:增量预训练、指令跟随

指令跟随微调

数据是一问一答的形式

对话模板构建

每个开源模型使用的对话模板都不相同

指令微调原理:

由于只有答案部分是我们期望模型来进行回答的内容,所以我们只对答案部分进行损失的计算

增量预训练微调

数据都是陈述句,没有问答形式

LoRA & QLoRA

XTuner中使用的微调原理:LoRA & QLoRA

如果我们要对整个模型的所有参数都进行调整的话,需要非常大的显存才能够进行训练,但是用LoRA的方法就不需要这么大的显存开销了

比较:全参数微调、LoRA、QLoRA

全参数微调:整个模型都要加载到显存中,所有模型参数的优化器也都要加载到显存中,显存不够根本无法进行·

LoRA:模型也是要先加载到显存中,但是我们只需要保存LoRA部分的参数优化器,大大减小了显存占用

QLoRA:加载模型时就使用4bit量化的方式加载(相当于不那么精确的加载),但是可以节省显存开销,QLoRA部分的参数优化器,还可以在GPU和CPU之间进行调度【这是Xtunner进行整合的功能 】,显存满了就自动去内存中去跑。

XTuner介绍


XTuner快速上手

  1. 安装
bash 复制代码
pip install xtuner
  1. 挑选配置模版
bash 复制代码
xtuner list-cfg -p internlm_20b
  1. 一键训练
bash 复制代码
xtuner train internlm_20b_qlora_oasst1_512_e3
  1. Config 命名规则

|-------|---------------------------------|
| 模型名 | internlm_20b ( 无 chat 代表是基座模型 ) |
| 使用算法 | qlora |
| 数据集 | oasst1 |
| 数据长度 | 512 |
| Epoch | e3, epoch 3 |

![在这里插入图片描述](https://img-blog.csdnimg.cn/direct/67e55262c53d4d988fa0948795877b8c.png) ![在这里插入图片描述](https://img-blog.csdnimg.cn/direct/2746f7cf958b47a1b2b388a43f5a9260.png) ![在这里插入图片描述](https://img-blog.csdnimg.cn/direct/3a93273b4b84489ca5be2e991156e1d6.png) ![在这里插入图片描述](https://img-blog.csdnimg.cn/direct/3a14ced892df4f02a58633f803aff1e9.png)

XTunner支持多数据的样本拼接,增加运行效率,输入模型,统一的进行梯度的传播

自定义数据集建议使用json格式

8GB显卡玩转LLM



动手实战环节

https://github.com/InternLM/tutorial/blob/main/xtuner/README.md

相关推荐
云上艺旅4 小时前
K8S学习之基础七十四:部署在线书店bookinfo
学习·云原生·容器·kubernetes
你觉得2054 小时前
哈尔滨工业大学DeepSeek公开课:探索大模型原理、技术与应用从GPT到DeepSeek|附视频与讲义下载方法
大数据·人工智能·python·gpt·学习·机器学习·aigc
A旧城以西5 小时前
数据结构(JAVA)单向,双向链表
java·开发语言·数据结构·学习·链表·intellij-idea·idea
无所谓จุ๊บ5 小时前
VTK知识学习(50)- 交互与Widget(一)
学习·vtk
FAREWELL000755 小时前
C#核心学习(七)面向对象--封装(6)C#中的拓展方法与运算符重载: 让代码更“聪明”的魔法
学习·c#·面向对象·运算符重载·oop·拓展方法
吴梓穆6 小时前
UE5学习笔记 FPS游戏制作38 继承标准UI
笔记·学习·ue5
Three~stone6 小时前
MySQL学习集--DDL
数据库·sql·学习
齐尹秦6 小时前
HTML 音频(Audio)学习笔记
学习
Ai尚研修-贾莲6 小时前
基于DeepSeek、ChatGPT支持下的地质灾害风险评估、易发性分析、信息化建库及灾后重建
人工智能·chatgpt
V---scwantop---信7 小时前
英文字体:大胆都市街头Y2Y涂鸦风格品牌海报专辑封面服装字体 Chrome TM – Graffiti Font
笔记·字体