书生·浦语大模型--第四节课笔记--XTuner大模型单卡低成本微调

文章目录

Finetune简介

增量预训练和指令跟随

通过指令微调获得instructed LLM

指令跟随微调

一问一答的方式进行

对话模板

计算损失

增量预训练微调

不需要问题只需要回答,都是陈述句。计算损失时和指令微调一样

LoRA QLoRA

不需要太大的显存开销。增加旁路分支Adapter。

比较:

  • 全参数微调:整个模型加载到显存中,所有模型的参数优化器也要加载到显存中
  • LoRA微调:模型也需要加载到显存中,但是参数优化器只需要LoRA部分
  • QLoRA微调:加载模型时就4bit量化加载,参数优化器还可以在CPU和GPU之间调度,显存满了可以在内存里跑

XTuner介绍

快速上手



8GB显卡玩转LLM

动手实战环节

相关推荐
surfirst13 分钟前
如何使用 ChatGPT 生成万字长文?
人工智能·chatgpt
AcademicIdeas学境思源15 分钟前
逆向推理+ChatGPT,让论文更具说服力
人工智能·深度学习
高性能服务器17 分钟前
AI 赋能大模型:从 ChatGPT 到国产大模型的角逐与发展契机
人工智能·chatgpt
wly47692308317 分钟前
研究生如何利用ChatGPT帮助开展日常科研工作?
人工智能·gpt·chatgpt·ai作画·stable diffusion·excel·音视频
AcademicIdeas学境思源21 分钟前
思维链在论文写作中的应用:借助ChatGPT构建完整、清晰的论证
人工智能
Einstein·Jun22 分钟前
深度学习--------------------------------门控循环单元GRU
人工智能·深度学习·gru
sp_fyf_202434 分钟前
[大语言模型-论文精读] 词性对抗性攻击:文本到图像生成的实证研究
人工智能·神经网络·机器学习·计算机视觉·语言模型·自然语言处理·数据挖掘
LearnTech_12337 分钟前
【学习笔记】手写 Tomcat 四
java·笔记·学习·tomcat·手写 tomcat
jndingxin39 分钟前
OpenCV视频I/O(10)视频采集类VideoCapture之从视频流中检索一帧图像函数 retrieve()的使用
人工智能·opencv·音视频
Eric.Lee20211 小时前
开启争对目标检测的100类数据集-信息收集
人工智能·深度学习·数据集·databall