llama-factory训练大模型

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档

文章目录


前言

随着人工智能的不断发展,机器学习这门技术也越来越重要,很多人都开启了学习机器学习,本文就介绍了AI大模型训练学习的基础内容。


一、LLaMA Factory是什么?

LLaMA Factory------一个像搭积木一样简单的大模型"定制工厂",统一支持百种模型与前沿微调法(QLoRA/GaLore等),可视化操作、低显存门槛,让小白也能轻松训练专属AI。

二、使用步骤

1.下载、安装、启动等

https://github.com/hiyouga/LLaMa-Factory

git clone https://github.com/hiyouga/LLaMa-Factory.git

cd LLaMa-Factory

pip install -e ".torch,metrics"

llamafactory-cli webui 启动可视化页面

2.下载大模型

首先安装modelscope,然后下载大模型

pip install modelscope

下载整个模型repo(到默认cache地址)

modelscope download --model deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B

默认下载完成后的地址:

/root/.cache/modelscope/hub/models/deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B

或者通过官网文档教程下载:https://www.modelscope.cn/docs/models/download

3.AutoDl算力平台

https://www.autodl.com/console/instance/list

服务启动后,可以通过这个进行代理,下载如下地址的工具:

https://api.autodl.com/docs/ssh_proxy/

4.启动服务后

通过本地的地址访问webui页面

5.设置数据集

6.训练完成以后

总结

人生物语:一个人的成熟,不是经历多少,而是经历后的沉淀和思考;一个人的痛苦,不是颓唐多少,而是痛苦后的醒悟和审视。一个人的人生,不在于成败,而是风雨中的坚强和执着。

相关推荐
世辰辰辰8 小时前
批量修改图片/文本名子
开发语言·python·批量修改文件名
myenjoy_110 小时前
MQTT 与 Sparkplug B——从车间到云端的最后一公里
网络·python
颜酱11 小时前
LangChain 输出解析器:把模型回复变成你要的数据
python·langchain
2401_8734794011 小时前
企业安全运营中,如何用IP离线库提前发现失陷主机?三步实现风险画像
网络·数据库·python·tcp/ip·ip
weixin_5231853212 小时前
Java基础知识总结(四):引用数据类型与参数传递机制
java·开发语言·python
码农飞哥12 小时前
我把RAG召回率从60%提到90%,就改了这两件事
python·知识库·向量检索·rag·效果提示
宸津-代码粉碎机12 小时前
Spring AI企业级实战|从RAG优化到Agent多工具调度
java·大数据·人工智能·后端·python·spring
yuhuofei202112 小时前
【Python入门】Python中的字典dict
python
Jinkxs13 小时前
Python基础 - 文件的写入操作 write与writelines方法
android·服务器·python
初学Python的小明13 小时前
Python格式化输出、运算符、分支&循环
python