【书生浦语第二期实战营学习笔记&作业(四)】

yqyn2024-04-26 19:38

课程文档：https://github.com/InternLM/Tutorial/blob/camp2/xtuner/readme.md

作业文档：https://github.com/InternLM/Tutorial/blob/camp2/xtuner/homework.md

书生浦语第二期实战营学习笔记&作业(四)

1.1、微调理论讲解及 XTuner 介绍

两种Finetune范式：增量预训练和指令跟随
增量预训练和指令跟随区别：
一条数据的一生：

1.2 微调方案 LoRA & QLoRA

LoRA介绍 ： LLM的参数量主要集中在模型中的Linear，训练这些参数会耗费大量的显存。
LoRA 通过在原本的Linear旁，新增一个支路，包含两个连续的小Linear，新增的这个支路通常叫做 Adapter。

Adapter 参数量远小于原本的Linear，能大幅降低训练的显存消耗

LoRA & QLoRA对比

2.1 XTuner简介

2.2 XTuner快速上手

2.3 XTuner数据引擎

3.1 多模态LLM

多模态LLM原理简介
LLaVA方案简介

LLaVA方案

作业：

准备数据集
模型训练

对话测试：
微调后的模型

微调前的模型

Web demo 部署：

上一篇：实验3

下一篇：VUE3与Uniapp 三（Class变量和内联样式）

热门推荐

01GitHub 镜像站点 02BongoCat - 跨平台键盘猫动画工具 03UV安装并设置国内源 04【保姆级教程】免费使用Gemini3的5种方法！免翻墙/国内直连 05Linux下V2Ray安装配置指南 06安娜的档案(Anna’s Archive) 镜像网站/国内最新可访问入口（持续更新）07“我的电脑”图标没了怎么办 4种方法找回 08全球最强模型Grok4，国内已可免费使用！（附教程）09KGG转MP3工具|非KGM文件|解密音频 1046个Nano-banana 精选提示词，持续更新中