【书生浦语第二期实战营学习笔记&作业(四)】

课程文档:https://github.com/InternLM/Tutorial/blob/camp2/xtuner/readme.md

作业文档:https://github.com/InternLM/Tutorial/blob/camp2/xtuner/homework.md

书生浦语第二期实战营学习笔记&作业(四)

1.1、微调理论讲解及 XTuner 介绍

  • 两种Finetune范式: 增量预训练和指令跟随
    增量预训练和指令跟随 区别:
  • 一条数据的一生:


1.2 微调方案 LoRA & QLoRA


LoRA介绍 : LLM的参数量主要集中在模型中的Linear,训练这些参数会耗费大量的显存。
LoRA 通过在原本的Linear旁,新增一个支路,包含两个连续的小Linear,新增的这个支路通常叫做 Adapter。

Adapter 参数量远小于原本的Linear,能大幅降低训练的显存消耗

LoRA & QLoRA对比

2.1 XTuner简介

2.2 XTuner快速上手


2.3 XTuner数据引擎


3.1 多模态LLM

  • 多模态LLM原理简介

  • LLaVA方案简介

LLaVA方案

作业:

  1. 准备数据集
  2. 模型训练


    对话测试:
    微调后的模型

    微调前的模型

    Web demo 部署:
相关推荐
lsnm14 分钟前
<刷题笔记> 二叉搜索树与双向链表注意事项
数据结构·笔记·链表
zhaoyushi0017 分钟前
python自学笔记
windows·笔记·python
清流君39 分钟前
【自动驾驶】控制算法(九)深度解析车辆纵向控制 | 从算法基础到 Carsim 仿真实践
人工智能·笔记·算法·自动驾驶·控制算法
-心铭-42 分钟前
有关在.Net Core中以TEXT类型将Json格式字段存到数据库的学习
数据库·学习·.netcore
凭栏落花侧1 小时前
现代前端框架实战指南:React、Vue.js、Angular核心概念与应用
前端·vue.js·经验分享·笔记·学习·react.js·前端框架
睡不着还睡不醒1 小时前
【操作系统强化】王道强化一轮笔记
笔记
今天我刷leetcode了吗2 小时前
【M-LOAM学习】
学习
笑鸿的学习笔记2 小时前
qt-C++笔记之作用等同的宏和关键字
c++·笔记·qt
freexyn2 小时前
Matlab自学笔记36:日期时间型的概念、分类和创建方法
数据结构·笔记·算法·matlab
云吟Xavze2 小时前
高等代数笔记(2)————(弱/强)数学归纳法
学习