书生·浦语大模型--第四节课笔记--XTuner大模型单卡低成本微调

李日音2024-01-24 20:53

文章目录

Finetune简介
- 指令跟随微调
- 增量预训练微调
- [LoRA QLoRA](#LoRA QLoRA)
XTuner介绍
- 快速上手
8GB显卡玩转LLM
动手实战环节

Finetune简介

增量预训练和指令跟随

通过指令微调获得instructed LLM

指令跟随微调

一问一答的方式进行

对话模板

计算损失

增量预训练微调

不需要问题只需要回答，都是陈述句。计算损失时和指令微调一样

LoRA QLoRA

不需要太大的显存开销。增加旁路分支Adapter。

比较：

全参数微调：整个模型加载到显存中，所有模型的参数优化器也要加载到显存中
LoRA微调：模型也需要加载到显存中，但是参数优化器只需要LoRA部分
QLoRA微调：加载模型时就4bit量化加载，参数优化器还可以在CPU和GPU之间调度，显存满了可以在内存里跑

XTuner介绍

快速上手

8GB显卡玩转LLM

动手实战环节

上一篇：VSCode 更换默认的 terminal(终端)

下一篇：蓝桥杯重要知识点和赛题直通车

热门推荐

01BongoCat - 跨平台键盘猫动画工具 02GitHub 镜像站点 03UV安装并设置国内源 04GitLab 零基础入门指南：从安装到项目管理全流程 05Linux下V2Ray安装配置指南 062025软件测试面试八股文（含答案+文档）07Labelme从安装到标注：零基础完整指南 08NVIDIA显卡驱动、CUDA、cuDNN 和 TensorRT 版本匹配指南 09在VSCode配置Java开发环境的保姆级教程（适配各类AI编程IDE）10【vue篇】Vue 项目中的静态资源管理：assets vs static 终极指南