CentOS8.5 LLaMA-Factory训练模型

注:VMware16 + CentOS8.5 虚拟机尝试,不能实现GPU直通,训练不能成功。需要单独服务器直接安装linux系统。还要查看自己的显卡是否支持CUDA

CUDA GPU | NVIDIA 开发者

魔搭社区下载模型需要安装:

复制代码
pip install modelscope

使用量化需要安装:

复制代码
pip install bitsandbytes

下载模型

模型库:模型库首页 · 魔搭社区

找到你需要的模型

例如:Llama-3.2-3B-Instruct

使用命令下载:

复制代码
modelscope download --model LLM-Research/Llama-3.2-3B-Instruct

默认下载的模型目录:

用户目录下的.cache/modelscope/hub/models/(cache前的点不要忽略)

LLaMA-Factory放入模型

复制代码
cd ~/LLaMA-Factory/

mkdir models/

cp -r ~/.cache/modelscope/hub/models/ ~/LLaMA-Factory/models/

运行LLaMA-Factory页面

复制代码
conda  activate llamafactory

llamafactory-cli webui

配置页面属性

本地模型需要填写全路径:

/root/LLaMA-Factory/models/models/LLM-Research/Llama-3.2-3B-Instruct

此时就表示,我们的模型可用了。

自定义数据集准备

下载示例数据集

以下是使用示例数据集的步骤,假设您使用的是PAI提供的多轮对话数据集:

复制代码
cd LLaMA-Factory
wget https://atp-modelzoo-sh.oss-cn-shanghai.aliyuncs.com/release/tutorials/llama_factory/data.zip
mv data data.bak
unzip data.zip -d data

查看数据集

设置训练参数

可以打开量化进行加速;

下方数据集是选择出现的,不是自己填进去的,如果不行,就把数据路径搞成全路径。

开始微调

在Web UI中设置好参数后,您可以开始模型微调过程。微调完成后,您可以在界面上观察到训练进度和损失曲线。

启动微调后需要等待大约20分钟,待模型下载完毕后,可在界面观察到训练进度和损失曲线。当显示训练完毕时,代表模型微调成功。

评估模型

未完成,待继续

相关推荐
这是程序猿14 分钟前
基于java的ssm框架学生作业管理系统
java·开发语言·spring boot·spring·学生作业管理系统
五月君_22 分钟前
Nuxt UI v4.3 发布:原生 AI 富文本编辑器来了,Vue 生态又添一员猛将!
前端·javascript·vue.js·人工智能·ui
wjykp25 分钟前
109~111集成学习
人工智能·机器学习·集成学习
XLYcmy30 分钟前
TarGuessIRefined密码生成器详细分析
开发语言·数据结构·python·网络安全·数据安全·源代码·口令安全
小程故事多_8031 分钟前
Spring AI 赋能 Java,Spring Boot 快速落地 LLM 的企业级解决方案
java·人工智能·spring·架构·aigc
xcLeigh34 分钟前
AI的提示词专栏:写作助手 Prompt,从提纲到完整文章
人工智能·ai·prompt·提示词
weixin_4334176739 分钟前
Canny边缘检测算法原理与实现
python·opencv·算法
QYR_1140 分钟前
热塑性复合树脂市场报告:行业现状、增长动力与未来机遇
大数据·人工智能·物联网
梨落秋霜43 分钟前
Python入门篇【元组】
android·数据库·python
nju_spy43 分钟前
强化学习 -- 无导数随机优化算法玩俄罗斯方块Tetris(交叉熵方法CE + ADP近似动态规划CBMPI)
人工智能·强化学习·策略迭代·近似动态规划·交叉熵方法·价值函数近似·无导数优化