基于LLaMA Factory对LLama 3指令微调的操作学习笔记

一、环境

在vscode中用连接云服务器,打开文件目录。

bash 复制代码
df -h #查看盘容量

二、下载LLaMA Factory框架和数据

下载LLaMA Factory到云服务器

bash 复制代码
git clone https://github.com/hiyouga/LLaMA-Factory.git
cd LLaMA-Factory
pip install -e .
pip install -e .命令的含义是在当前目录下查找一个setup.py文件(或其他pyproject.toml文件,取决于包的配置),并根据该文件的指示以可编辑模式安装包。

将下载的数据放到LLaMA Factory data文件夹下,同时将json格式输入到dataset_info.json文件中。

启动 Web UI

bash 复制代码
cd LLaMA-Factory
llamafactory-cli webui

三、下载模型

用中文微调过的模型。

bash 复制代码
pip install -U huggingface_hub
pip install huggingface-cli

export HF_ENDPOINT=https://hf-mirror.com

huggingface-cli download --resume-download shenzhi-wang/Llama3-8B-Chinese-Chat --local-dir /root/autodl-tmp/models/Llama3-8B-Chinese-Chat1

四、微调训练和推理

加速方式选择unsloth会报错unsloth不存在

推理的时候选择vllm也会报错版本不合适。

gpu使用情况监控和进程杀死

【工具篇】如何优雅地监控显卡(GPU)使用情况? - 知乎 (zhihu.com)

终止进程后,GPU显存仍被占用问题: kill -9彻底杀死进程 | ps aux|grep python | 怎么确认僵尸进程?_杀死进程后显存还是没有下降-CSDN博客

还需要学习Unsloth 上进行微调

基于unsloth微调llama3.1_哔哩哔哩_bilibili

参考说明

【大模型微调】使用Llama Factory实现中文llama3微调_哔哩哔哩_bilibili

LLaMA-Factory: 大语言模型统一高效微调框架 (gitee.com)

cgft-llm/llama-factory/README.md at master · echonoshy/cgft-llm · GitHub

相关推荐
Guofu_Liao5 小时前
大语言模型---LoRA简介;LoRA的优势;LoRA训练步骤;总结
人工智能·语言模型·自然语言处理·矩阵·llama
AI_小站13 小时前
RAG 示例:使用 langchain、Redis、llama.cpp 构建一个 kubernetes 知识库问答
人工智能·程序人生·langchain·kubernetes·llama·知识库·rag
Guofu_Liao13 小时前
Llama模型文件介绍
人工智能·llama
Donvink18 小时前
多模态大语言模型——《动手学大模型》实践教程第六章
人工智能·深度学习·语言模型·自然语言处理·llama
Donvink21 小时前
大模型安全和越狱攻击——《动手学大模型》实践教程第五章
深度学习·安全·语言模型·llama
Donvink21 小时前
大模型智能体安全——《动手学大模型》实践教程第七章
深度学习·安全·语言模型·prompt·llama
慢热型网友.1 天前
【项目实战】基于 LLaMA-Factory 通过 LoRA 微调 Qwen2
llama
机器学习是魔鬼1 天前
LLaMA-Factory 上手即用教程
llama·模型训练·ai功能岛·矩池云
Galeoto1 天前
fine tuning with llama-factory
llama
Struart_R2 天前
LLaMA-Mesh: Unifying 3D Mesh Generation with Language Models 论文解读
语言模型·llama·多模态·三维生成·自回归