书生·浦语大模型--第四节课笔记--XTuner大模型单卡低成本微调

文章目录

Finetune简介

增量预训练和指令跟随

通过指令微调获得instructed LLM

指令跟随微调

一问一答的方式进行

对话模板

计算损失

增量预训练微调

不需要问题只需要回答,都是陈述句。计算损失时和指令微调一样

LoRA QLoRA

不需要太大的显存开销。增加旁路分支Adapter。

比较:

  • 全参数微调:整个模型加载到显存中,所有模型的参数优化器也要加载到显存中
  • LoRA微调:模型也需要加载到显存中,但是参数优化器只需要LoRA部分
  • QLoRA微调:加载模型时就4bit量化加载,参数优化器还可以在CPU和GPU之间调度,显存满了可以在内存里跑

XTuner介绍

快速上手



8GB显卡玩转LLM

动手实战环节

相关推荐
————A17 小时前
强化学习----->轨迹、回报、折扣因子和回合
人工智能·python
CareyWYR18 小时前
每周AI论文速递(251215-251219)
人工智能
做cv的小昊18 小时前
【TJU】信息检索与分析课程笔记和练习(1)认识文献
经验分享·笔记·学习·搜索引擎·全文检索
weixin_4093831218 小时前
在kaggle训练Qwen/Qwen2.5-1.5B-Instruct 通过中二时期qq空间记录作为训练数据 训练出中二的模型为目标 第一次训练 好像太二了
人工智能·深度学习·机器学习·qwen
长桥夜波18 小时前
【第二十四周】文献阅读-第一人称下的手势识别(1)
机器学习
JoannaJuanCV18 小时前
自动驾驶—CARLA仿真(22)manual_control_steeringwheel demo
人工智能·自动驾驶·pygame·carla
余俊晖18 小时前
使用Agent做本体匹配的架构设计
人工智能·语言模型·自然语言处理
图像生成小菜鸟18 小时前
Score Based diffusion model 数学推导
算法·机器学习·概率论
读创商闻18 小时前
崇明岛西滩湿地:离都市最近的候鸟观测笔记
笔记
科士威传动18 小时前
方形滚珠导轨如何保障高速定位精度?
人工智能·科技·机器人·自动化·制造