llamafactory 安装和使用

1、安装

bash 复制代码
conda create -n llama_factory python=3.11

# 如果要加学术加速的话,git clone https://ghfast.top/https://github.com/hiyouga/LLaMA-Factory.git

git clone https://github.com/hiyouga/LLaMA-Factory.git

cd LLaMA-Factory

source activate llama_factory 

pip install -e .

2、使用

bash 复制代码
# 打开UI页面进行微调
cd /root/autodl-tmp/LLaMA-Factory

source activate llama_factory

llamafactory-cli webui

3、训练设置

将这要训练的数据集丢到/root/autodl-tmp/LLaMA-Factory/data里面
页面上的设置:

调整batch size,让GPU使用达到80%左右

4、llamafactory要求的数据集格式

单论对话

instruction是问,output是回答

多轮对话

instruction是最新一轮的问,output是最新一轮的回答,history是之前的问和回答

input是对instruction数据的补充。

4、查看结果

将训练得到的lora模型,加载到checkpoint里

相关推荐
极光代码工作室1 天前
基于BERT的新闻文本分类系统
深度学习·nlp·bert·文本分类
Learn Beyond Limits2 天前
神经机器翻译|Neural Machine Translation(NMT)
人工智能·神经网络·机器学习·ai·自然语言处理·nlp·机器翻译
羊小猪~~3 天前
LLM--VIT简介
大模型·llm·nlp·多模态·多模态大模型·vit·ai算法
lin_dec+4 天前
KV Cache:大模型推理加速的关键技术
nlp·transformer·vllm·大模型推理·kv cache
Learn Beyond Limits4 天前
多层循环神经网络|Multi-layer RNNs
人工智能·rnn·深度学习·神经网络·机器学习·自然语言处理·nlp
羊小猪~~5 天前
LLM--BERT架构解析
人工智能·深度学习·大模型·llm·nlp·bert·ai算法
带娃的IT创业者5 天前
期中总结:从神经元到 GPT——AI 架构全景回顾(Version B)
人工智能·gpt·深度学习·神经网络·架构·nlp·transformer
Learn Beyond Limits7 天前
长短期记忆网络|LSTM(Long Short-Term Memory)
人工智能·rnn·深度学习·神经网络·自然语言处理·nlp·lstm
Learn Beyond Limits7 天前
双向循环神经网络|Bi-RNN(Bidirectional Recurrent Neural Networks)
人工智能·rnn·深度学习·神经网络·语言模型·自然语言处理·nlp
请数据别和我作队7 天前
基于 DeepSeek API 的 ASR 文本纠错脚本实战:Python 多线程批量处理 JSONL 语音转写数据
开发语言·经验分享·python·自然语言处理·nlp