政安晨的AI大模型训练实践三:熟悉一下LF训练模型的WebUI

政安晨的个人主页:************政安晨****************

欢迎 👍点赞✍评论⭐收藏

希望政安晨的博客能够对您有所裨益,如有不足之处,欢迎在评论区提出指正!

目录

启动WebUI

微调模型


LLaMA-Factory 支持通过 WebUI 零代码微调大语言模型。


启动WebUI

打开前两篇我们创建的conda虚拟环境之后,输入命令:

复制代码
llamafactory-cli webui

这样就启动了LLaMA Factory的webui页面:

如果您在 Hugging Face 模型和数据集下载中遇到了问题,可以通过下述方法使用魔搭社区。

export USE_MODELSCOPE_HUB=1

Windows 使用set USE_MODELSCOPE_HUB=1

将 model_name_or_path 设置为模型 ID 来加载对应的模型。

在魔搭社区查看所有可用的模型,例如 LLM-Research/Meta-Llama-3-8B-Instruct。

您也可以通过下述方法,使用魔乐社区下载数据集和模型。

export USE_OPENMIND_HUB=1

Windows 使用set USE_OPENMIND_HUB=1

将 model_name_or_path 设置为模型 ID 来加载对应的模型。

在魔乐社区查看所有可用的模型,例如 TeleAI/TeleChat-7B-pt。

当然,设置了环境变量之后,重启环境,以使上面这个设置生效。

如果再下载过程中出现错误,有可能是您没有安装相应的工具:

复制代码
pip install modelscope>=1.11.0

安装好工具后,再重新启动工具:

在webUI中执行加载模型:

在命令行后台中可以看到下载的状态如下:

下载完成后,可以看到加载成功:

如果本地空间出现一些问题,可以在这里修改模型路径,重新下载:

这里我把模型地址修改为:/home/tongyuzhou/aigc2/Llama-3/Llama-3.2-1B

然后重新加载(把刚刚下载的模型拷贝到这里),重新加载即可。

如果过程中出现失败,重新启动整套环境再尝试,默认路径不要修改才会自动加载,修改了之后就会从该地址加载模型了,如果该路径下没有模型就会报错。

微调模型

在这里可以微调数据:

可以选择一个数据集尝试:

预览一下:

可以直接点击这里完成训练:


本篇仅仅是个预览,接下来,我会带着大家仔仔细细地做一遍。

相关推荐
DisonTangor3 分钟前
谷歌开源首个扩散大语言模型——DiffusionGemma
人工智能·语言模型·自然语言处理·开源·aigc·transformer
科技林总5 分钟前
解决vllm服务漏扫问题
python·安全
冬奇Lab6 分钟前
每日一个开源项目(第129篇):OpenMed - 永不离开设备的医疗 NLP
人工智能·开源·资讯
冬奇Lab8 分钟前
Agent 系列(19):Harness 完整体系——8 层防护框架全景
人工智能·llm·agent
米小虾8 分钟前
Claude Fable 5 系统提示词被扒出来了:1586 行代码背后,藏着 AI 产品工程的终极哲学
人工智能·agent
云烟成雨TD11 分钟前
Spring AI Alibaba 1.x 系列【77】执行取消
java·人工智能·spring
Teacher.chenchong12 分钟前
AI-Agent2.0 科研全链路实战营:LLM+NotebookLM + 自动化编程 + 文献管理 + 论文写作,搭建本地科研智能体
人工智能·自动化
weberCd16 分钟前
ChatGPT 实用技巧总结(国内)
人工智能·chatgpt
我爱cope21 分钟前
【Agent智能体26 | 多智能体-多智能体工作流】
人工智能·设计模式·语言模型·职场和发展
吴佳浩41 分钟前
炸裂!!!给 codeX 装上本地大脑:cc-switch_Ollama 接入全记录
人工智能·rust·openai