llamafactory 安装和使用

1、安装

bash 复制代码
conda create -n llama_factory python=3.11

# 如果要加学术加速的话,git clone https://ghfast.top/https://github.com/hiyouga/LLaMA-Factory.git

git clone https://github.com/hiyouga/LLaMA-Factory.git

cd LLaMA-Factory

source activate llama_factory 

pip install -e .

2、使用

bash 复制代码
# 打开UI页面进行微调
cd /root/autodl-tmp/LLaMA-Factory

source activate llama_factory

llamafactory-cli webui

3、训练设置

将这要训练的数据集丢到/root/autodl-tmp/LLaMA-Factory/data里面
页面上的设置:

调整batch size,让GPU使用达到80%左右

4、llamafactory要求的数据集格式

单论对话

instruction是问,output是回答

多轮对话

instruction是最新一轮的问,output是最新一轮的回答,history是之前的问和回答

input是对instruction数据的补充。

4、查看结果

将训练得到的lora模型,加载到checkpoint里

相关推荐
Rabbit_QL2 天前
【BPE实战】从零实现 BPE 分词器:训练、编码与解码
python·算法·nlp
这张生成的图像能检测吗3 天前
(论文速读)XLNet:语言理解的广义自回归预训练
人工智能·计算机视觉·nlp·注意力机制
肾透侧视攻城狮3 天前
《NLP核心能力构建:从传统统计到上下文感知的文本表示演进之路》
人工智能·nlp·fasttext·word2vec/glove·elmo/n-gram/词袋·doc2vec/lda·句向量与文档向量
换个名字就很好4 天前
cursor安装和编程
nlp
智海观潮4 天前
Vanna-ai - 让自然语言对话SQL数据库成为可能,支持多种数据库,大模型和向量存储
大数据·nlp·aigc
TvxzFtDBIxok10 天前
基于MATLAB/Simulink的4机10节点系统暂态稳定性仿真
nlp
查无此人byebye13 天前
【超详细解读(GPU)】基于DiT的MNIST扩散模型(DDPM)完整实现
python·深度学习·nlp·transformer·多分类
乌萨奇53713 天前
【2025考研复试】深度学习扩展知识:从ViT到多模态,以及简历项目挖掘策略(第11章复盘)
人工智能·深度学习·考研·计算机视觉·nlp·多模态
查无此人byebye13 天前
基于DiT+DDPM的MNIST数字生成:模型推理实战教程
人工智能·python·深度学习·nlp·transformer
Yaozh、14 天前
【word2vec模型】两种模型结构CBOW和Skip-gram的具体过程
人工智能·深度学习·神经网络·自然语言处理·nlp·word2vec