llama-factory训练大模型

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档

文章目录


前言

随着人工智能的不断发展,机器学习这门技术也越来越重要,很多人都开启了学习机器学习,本文就介绍了AI大模型训练学习的基础内容。


一、LLaMA Factory是什么?

LLaMA Factory------一个像搭积木一样简单的大模型"定制工厂",统一支持百种模型与前沿微调法(QLoRA/GaLore等),可视化操作、低显存门槛,让小白也能轻松训练专属AI。

二、使用步骤

1.下载、安装、启动等

https://github.com/hiyouga/LLaMa-Factory

git clone https://github.com/hiyouga/LLaMa-Factory.git

cd LLaMa-Factory

pip install -e ".[torch,metrics]"

llamafactory-cli webui 启动可视化页面

2.下载大模型

首先安装modelscope,然后下载大模型

pip install modelscope

下载整个模型repo(到默认cache地址)

modelscope download --model deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B

默认下载完成后的地址:

/root/.cache/modelscope/hub/models/deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B

或者通过官网文档教程下载:https://www.modelscope.cn/docs/models/download

3.AutoDl算力平台

https://www.autodl.com/console/instance/list

服务启动后,可以通过这个进行代理,下载如下地址的工具:

https://api.autodl.com/docs/ssh_proxy/

4.启动服务后

通过本地的地址访问webui页面

5.设置数据集

6.训练完成以后

总结

人生物语:一个人的成熟,不是经历多少,而是经历后的沉淀和思考;一个人的痛苦,不是颓唐多少,而是痛苦后的醒悟和审视。一个人的人生,不在于成败,而是风雨中的坚强和执着。

相关推荐
70asunflower19 小时前
Python 开发实用技巧集锦
开发语言·python
睡眠艺术家(✿◡‿◡)19 小时前
Python五. 程序控制结构(详细解释)
开发语言·python
cvcode_study19 小时前
Jupyter Notebook
python·jupyter
70asunflower19 小时前
Python `pathlib` 模块使用教程
python
淘矿人19 小时前
Claude助力后端开发
java·开发语言·人工智能·python·github·php·pygame
JAVA面经实录91719 小时前
Java集合100道面试真题(背诵完整版)
java·python·面试
Cloud_Shy61819 小时前
Python 数据分析基础入门:《Excel Python:飞速搞定数据分析与处理》学习笔记系列(第十一章 Python 包跟踪器 上篇)
python·数据分析·excel·pandas·matplotlib
星越华夏19 小时前
msvcrt库在pycharm中运行监控键盘操作无效解决办法
ide·python·pycharm
XGeFei19 小时前
python解释器/多线程程序
开发语言·python
阿正的梦工坊19 小时前
Kotlin 中的 ?. 和 . 语法详解
开发语言·python·kotlin