LlaMA_Factory实战微调VL大模型

VL微调数据格式文件样例如下

一:微调数据集准备

1、制作微调数据集

首先找到data文件夹下方的mllm_demo.json,确认微调VL模型时的数据格式模板,然后按照模板,制作对应的指令微调数据集。

2、确认微调模型认知

打开identity.json文件,修改模型初步认知,确认微调后模型的名称和开发者,如下。

3、进入dataset_info.json,添加数据集,修改文件夹名称和对应标注json文件名即可

复制代码
"****_vl_data(图片文件夹名称)": {
    "file_name": "****_vl_data.json(对应的json文件名称)",
    "formatting": "sharegpt",
    "columns": {
      "messages": "messages",
      "images": "images"
    },
    "tags": {
      "role_tag": "role",
      "content_tag": "content",
      "user_tag": "user",
      "assistant_tag": "assistant"
    }
  }

二:启动训练

1、先下载模型文件

2、web端启动命令

复制代码
llamafactory-cli webui

配置参数

启动训练后使用显存大小:50924MiB≈49.7G(这个有大佬知道正常吗,7B参数按照这个训练要这么大的显存?),共143条数据,15Epoch所用时间为:40min

训练曲线如下所示

但是感觉没怎么收敛啊,准备在加几轮训练一下

修改参数:参数部分可参照该链接,说的很详细

https://blog.csdn.net/qq_62223405/article/details/149500255?fromshare=blogdetail\&sharetype=blogdetail\&sharerId=149500255\&sharerefer=PC\&sharesource=weixin_42225889\&sharefrom=from_link

在15个epoch时模型训练稳定

中断训练,然后导出模型文件进行测试,完成训练

二:增加到一共300条数据,使用3B进行训练

配置如下

占用显存大小为:32364MiB≈31.6G

用时40分钟达到稳定,,epoch=12左右,中断测试

相关推荐
喜欢吃豆2 天前
掌握本地化大语言模型部署:llama.cpp 工作流与 GGUF 转换内核全面技术指南
人工智能·语言模型·架构·大模型·llama·llama.cpp·gguf
illuspas4 天前
Ubuntu 24.04下编译支持ROCm加速的llama.cpp
linux·ubuntu·llama
缘友一世7 天前
LLama3架构原理浅浅学学
人工智能·自然语言处理·nlp·transformer·llama
我们没有完整的家8 天前
批量吞吐量实测:Llama-2-7b 昇腾 NPU 六大场景数据报告
llama
asfdsfgas8 天前
从加载到推理:Llama-2-7b 昇腾 NPU 全流程性能基准
人工智能·llama
asdfsdgss8 天前
FP16 vs INT8:Llama-2-7b 昇腾 NPU 精度性能基准报告
llama
猿代码_xiao8 天前
大模型微调完整步骤( LLama-Factory)
人工智能·深度学习·自然语言处理·chatgpt·llama·集成学习
wei_shuo10 天前
Llama-2-7b 昇腾 NPU 测评总结:核心性能数据、场景适配建议与硬件选型参考
大模型·llama·昇腾
凯子坚持 c10 天前
Llama-2-7b在昇腾NPU上的六大核心场景性能基准报告
java·开发语言·llama
落798.10 天前
【在昇腾NPU上部署Llama-2-7B:从环境配置到性能测试的完整实战】
经验分享·llama·1024程序员节