llamafactory 安装和使用

1、安装

bash 复制代码
conda create -n llama_factory python=3.11

# 如果要加学术加速的话,git clone https://ghfast.top/https://github.com/hiyouga/LLaMA-Factory.git

git clone https://github.com/hiyouga/LLaMA-Factory.git

cd LLaMA-Factory

source activate llama_factory 

pip install -e .

2、使用

bash 复制代码
# 打开UI页面进行微调
cd /root/autodl-tmp/LLaMA-Factory

source activate llama_factory

llamafactory-cli webui

3、训练设置

将这要训练的数据集丢到/root/autodl-tmp/LLaMA-Factory/data里面
页面上的设置:

调整batch size,让GPU使用达到80%左右

4、llamafactory要求的数据集格式

单论对话

instruction是问,output是回答

多轮对话

instruction是最新一轮的问,output是最新一轮的回答,history是之前的问和回答

input是对instruction数据的补充。

4、查看结果

将训练得到的lora模型,加载到checkpoint里

相关推荐
AI技术控1 天前
RAG 怎么做 Query 改写?从工程实践看检索增强生成的第一道关键关卡
人工智能·语言模型·自然语言处理·oracle·nlp
AI技术控4 天前
ReAct 论文解读:大模型 Agent 如何通过“推理 + 行动”完成复杂任务
人工智能·python·语言模型·自然语言处理·nlp
王_teacher6 天前
GRU (Gated Recurrent Unit,门控循环单元) 原理详解 并且手写GRU模型
人工智能·gru·llm·nlp
王_teacher7 天前
LSTM 原理详解手动编写LSTM模型代码
人工智能·llm·nlp·lstm
Resistance丶未来7 天前
从零构建大语言模型:核心原理与实战落地
人工智能·ai·语言模型·自然语言处理·nlp·多模态大模型·ai工具
Jmayday8 天前
RNN案例之:人名分类器
人工智能·rnn·深度学习·nlp
Jmayday8 天前
NLP第三章:注意力机制
人工智能·自然语言处理·nlp
极光代码工作室12 天前
基于NLP的智能问答系统设计
python·深度学习·自然语言处理·nlp
Resistance丶未来15 天前
Agency-Agents 多智能体协作系统落地指南
python·大模型·nlp·github·copilot·claude·gemini
极光代码工作室17 天前
基于深度学习的微博情感分析系统
人工智能·深度学习·神经网络·nlp·情感分析