llama-factory训练大模型

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档

文章目录


前言

随着人工智能的不断发展,机器学习这门技术也越来越重要,很多人都开启了学习机器学习,本文就介绍了AI大模型训练学习的基础内容。


一、LLaMA Factory是什么?

LLaMA Factory------一个像搭积木一样简单的大模型"定制工厂",统一支持百种模型与前沿微调法(QLoRA/GaLore等),可视化操作、低显存门槛,让小白也能轻松训练专属AI。

二、使用步骤

1.下载、安装、启动等

https://github.com/hiyouga/LLaMa-Factory

git clone https://github.com/hiyouga/LLaMa-Factory.git

cd LLaMa-Factory

pip install -e ".[torch,metrics]"

llamafactory-cli webui 启动可视化页面

2.下载大模型

首先安装modelscope,然后下载大模型

pip install modelscope

下载整个模型repo(到默认cache地址)

modelscope download --model deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B

默认下载完成后的地址:

/root/.cache/modelscope/hub/models/deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B

或者通过官网文档教程下载:https://www.modelscope.cn/docs/models/download

3.AutoDl算力平台

https://www.autodl.com/console/instance/list

服务启动后,可以通过这个进行代理,下载如下地址的工具:

https://api.autodl.com/docs/ssh_proxy/

4.启动服务后

通过本地的地址访问webui页面

5.设置数据集

6.训练完成以后

总结

人生物语:一个人的成熟,不是经历多少,而是经历后的沉淀和思考;一个人的痛苦,不是颓唐多少,而是痛苦后的醒悟和审视。一个人的人生,不在于成败,而是风雨中的坚强和执着。

相关推荐
52Hz1185 分钟前
力扣20.有效的括号、155.最小栈
python·算法·leetcode
小鸡吃米…43 分钟前
TensorFlow 实现多层感知机学习
人工智能·python·tensorflow
WW、forever1 小时前
【服务器】上传服务器中数据至 FigShare(Python)
运维·服务器·python
宝贝儿好1 小时前
【强化学习】第十章:随机高斯策略
人工智能·python·深度学习·神经网络·机器人·自动驾驶
haosend1 小时前
【练习版】使用paramiko批量的查询,管理,配置路由器交换机
python·路由器·交换机·网络自动化
Dxy12393102162 小时前
Python生成随机手机号码
开发语言·python
小帅学编程2 小时前
Python学习
开发语言·python·学习
两万五千个小时2 小时前
构建mini Claude Code:08 - Fire and Forget:用后台线程解锁 Multi-Agent 并行执行
人工智能·python·架构
JaydenAI2 小时前
[拆解LangChain执行引擎]支持自然语言查询的长期存储
python·langchain
dreams_dream3 小时前
Python 的 GIL 是什么?有什么影响?
开发语言·python