书生·浦语大模型第二期实战营第四节-XTuner 微调 LLM:1.8B、多模态、Agent 作业-XTuner 微调个人小助手认知

视频教程:XTuner 微调 LLM:1.8B、多模态、Agent

文字教程:XTuner 微调 LLM:1.8B、多模态、Agent

作业来源:

XTuner 微调个人小助手认知

1. 环境安装

2.准备工作

2.1 数据准备

2.2 模型准备

2.3 配置文件选择

3. 配置文件修改

4. 模型训练

4.1 训练

准备好了配置文件后,只需要将使用 xtuner train 指令即可开始训练。

可以通过添加 --work-dir 指定特定的文件保存位置,比如说就保存在 /root/ft/train 路径下。假如不添加的话模型训练的过程文件将默认保存在 ./work_dirs/internlm2_1_8b_qlora_alpaca_e3_copy 的位置,就比如说我是在 /root/ft/train 的路径下输入该指令,那么我的文件保存的位置就是在 /root/ft/train/work_dirs/internlm2_1_8b_qlora_alpaca_e3_copy 的位置下。

4.2 对话测试

4.3 web端

相关推荐
码农小旋风15 小时前
大语言模型基础
开发语言·人工智能·语言模型·自然语言处理·chatgpt·claude
硅谷秋水16 小时前
SkillVLA:通过技能复用应对双-臂操纵中的组合多样性
机器学习·计算机视觉·语言模型·机器人
惊鸿一博17 小时前
大语言模型_概念_Transformer_位置编码 RoPE 解释
人工智能·语言模型·transformer
东方佑17 小时前
OpenASH-85M:基于累积最大值注意力的无 Softmax 语言模型,支持有状态推理
人工智能·语言模型·自然语言处理
暴躁小师兄数据学院19 小时前
【AI大模型应用开发工程师特训】第01讲—AI在企业中的定位
大数据·python·ai·语言模型
硅谷秋水20 小时前
ALRM:用于机器人操纵的智体大语言模型
人工智能·语言模型·机器人
LCG元21 小时前
大模型LoRA微调与推理优化:从显存溢出到低延迟部署的进阶之路
人工智能·语言模型
P-ShineBeam21 小时前
智能体-DeepAgent入门
人工智能·python·算法·语言模型·自然语言处理
星辰AI1 天前
Transformers 架构核心原理:从注意力机制到 GPT
人工智能·ai·语言模型
星辰AI1 天前
LLM 安全与对齐技术:构建可信赖的人工智能
人工智能·ai·语言模型