LlaMA_Factory实战微调Qwen-LLM大模型

1、数据集准备

复制代码
{
	"instruction": instruction,   	# 提示词
	"keypoint": keypoint,         	# 关键字
	"input": input,                 	# 用户输入+问题
	"output": out_put               # 指定输出
 }

2、添加数据集格式

在data文件夹-dataset_info.json中添加制作好的数据集,文本训练添加参考格式如下

复制代码
"alpaca_zh_demo": {
    "file_name": "alpaca_zh_demo.json"
}

总数据量:6448条

3、启动面板命令

复制代码
CUDA_VISIBLE_DEVICES=x llamafactory-cli webui  		#  x指定显卡

4、参数配置

主要参数:

epoch:8

截断长度:2048

数据量:6448

显存占用:14942MiB

其他默认即可,开始训练

显示训练完时间大概9小时左右

5、训练过程,观察并不是很收敛,且忘记设置截断长度,训练样本较长

6、修改参数重新训练

修改截断长度为10240,增加验证集比例,训练时长显示大约24H,显存占用:61620MiB

训练曲线:

最终曲线

输入数据格式:

复制代码
inputs:

<|im_start|>system
You are Qwen, created by Alibaba Cloud. You are a helpful assistant.<|im_end|>

<|im_start|>user
作为一个的AI助手,你的目标是帮助客户阅读并回答问题。
文件内容:督促施工单位确保本工程按期或提前完成.......。
用户问题:业绩要求
<|im_end|>

<|im_start|>assistant
业绩要求:见投标人须知前附表.....<|im_end|>

但是输入格式为:

复制代码
{
        "instruction": "作为一个的AI助手,你的目标是帮助客户阅读并回答问题。",
        "keypoint": "业绩相关评审标准",
        "input": "文件内容:【一级标题】.....\n\n     用户问题:业绩要求\n",
        "output": "业绩要求:见投标人须知前附表。"
    }

系统会将原始数据的instruction和input合并作为用户输入

相关推荐
f***a3465 分钟前
开源模型应用落地-工具使用篇-Spring AI-高阶用法(九)
人工智能·spring·开源
用户5191495848458 分钟前
BBDown:高效便捷的哔哩哔哩视频下载工具
人工智能·aigc
CV实验室10 分钟前
CV论文速递:覆盖视频生成与理解、3D视觉与运动迁移、多模态与跨模态智能、专用场景视觉技术等方向 (11.17-11.21)
人工智能·计算机视觉·3d·论文·音视频·视频生成
●VON11 分钟前
AI不能做什么?澄清常见误解
人工智能
数据堂官方账号18 分钟前
行业洞见 | AI鉴伪:数据驱动的数字安全变革
人工智能·安全
能鈺CMS19 分钟前
内容付费系统全面解析:构建知识变现体系的最强工具(2025 SEO 深度专题)
大数据·人工智能·html
【建模先锋】39 分钟前
论文复现!基于SAM-BiGRU网络的锂电池RUL预测
深度学习·论文复现·锂电池寿命预测·锂电池数据集·寿命预测
Salt_07281 小时前
DAY 19 数组的常见操作和形状
人工智能·python·机器学习
无心水1 小时前
【Python实战进阶】2、Jupyter Notebook终极指南:为什么说不会Jupyter就等于不会Python?
python·jupyter·信息可视化·binder·google colab·python实战进阶·python工程化实战进阶
技术探索家1 小时前
别再让Claude乱写代码了!一个配置文件让AI准确率提升10%
人工智能