提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档
文章目录
前言
随着人工智能的不断发展,机器学习这门技术也越来越重要,很多人都开启了学习机器学习,本文就介绍了AI大模型训练学习的基础内容。
一、LLaMA Factory是什么?
LLaMA Factory------一个像搭积木一样简单的大模型"定制工厂",统一支持百种模型与前沿微调法(QLoRA/GaLore等),可视化操作、低显存门槛,让小白也能轻松训练专属AI。
二、使用步骤
1.下载、安装、启动等
https://github.com/hiyouga/LLaMa-Factory
git clone https://github.com/hiyouga/LLaMa-Factory.git
cd LLaMa-Factory
pip install -e ".[torch,metrics]"
llamafactory-cli webui 启动可视化页面
2.下载大模型
首先安装modelscope,然后下载大模型
pip install modelscope
下载整个模型repo(到默认cache地址)
modelscope download --model deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B
默认下载完成后的地址:
/root/.cache/modelscope/hub/models/deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B
或者通过官网文档教程下载:https://www.modelscope.cn/docs/models/download
3.AutoDl算力平台
https://www.autodl.com/console/instance/list
服务启动后,可以通过这个进行代理,下载如下地址的工具:
https://api.autodl.com/docs/ssh_proxy/

4.启动服务后
通过本地的地址访问webui页面

5.设置数据集

6.训练完成以后

总结
人生物语:一个人的成熟,不是经历多少,而是经历后的沉淀和思考;一个人的痛苦,不是颓唐多少,而是痛苦后的醒悟和审视。一个人的人生,不在于成败,而是风雨中的坚强和执着。