llama-factory训练大模型

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档

文章目录


前言

随着人工智能的不断发展,机器学习这门技术也越来越重要,很多人都开启了学习机器学习,本文就介绍了AI大模型训练学习的基础内容。


一、LLaMA Factory是什么?

LLaMA Factory------一个像搭积木一样简单的大模型"定制工厂",统一支持百种模型与前沿微调法(QLoRA/GaLore等),可视化操作、低显存门槛,让小白也能轻松训练专属AI。

二、使用步骤

1.下载、安装、启动等

https://github.com/hiyouga/LLaMa-Factory

git clone https://github.com/hiyouga/LLaMa-Factory.git

cd LLaMa-Factory

pip install -e ".[torch,metrics]"

llamafactory-cli webui 启动可视化页面

2.下载大模型

首先安装modelscope,然后下载大模型

pip install modelscope

下载整个模型repo(到默认cache地址)

modelscope download --model deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B

默认下载完成后的地址:

/root/.cache/modelscope/hub/models/deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B

或者通过官网文档教程下载:https://www.modelscope.cn/docs/models/download

3.AutoDl算力平台

https://www.autodl.com/console/instance/list

服务启动后,可以通过这个进行代理,下载如下地址的工具:

https://api.autodl.com/docs/ssh_proxy/

4.启动服务后

通过本地的地址访问webui页面

5.设置数据集

6.训练完成以后

总结

人生物语:一个人的成熟,不是经历多少,而是经历后的沉淀和思考;一个人的痛苦,不是颓唐多少,而是痛苦后的醒悟和审视。一个人的人生,不在于成败,而是风雨中的坚强和执着。

相关推荐
枫叶林FYL23 分钟前
第10章 符号推理与神经符号AI
pytorch·python·深度学习
nimadan121 小时前
剧本杀app2025推荐,多类型剧本体验与社交互动优势
人工智能·python
HAPPY酷1 小时前
Python高阶开发:从底层原理到架构设计的进阶之路
开发语言·python
疯狂打码的少年2 小时前
【Day 6 Java转Python】字符串处理的“降维打击”
java·开发语言·python
2301_764441332 小时前
家国同构模型:计算社会学的创新探索
python·数学建模
ShCDNay2 小时前
Python核心底层知识(个人记录)
开发语言·python
来自远方的老作者2 小时前
第7章 运算符-7.2 赋值运算符
开发语言·数据结构·python·赋值运算符
来自远方的老作者3 小时前
第7章 运算符-7.1 算术运算符
开发语言·数据结构·python·算法·算术运算符
tq6J5Yg143 小时前
windows10本地部署openclaw
前端·python
pl4H522a63 小时前
Python 高效实现 Excel 转 TXT 文本
java·python·excel