llamafactory 安装和使用

1、安装

bash 复制代码
conda create -n llama_factory python=3.11

# 如果要加学术加速的话,git clone https://ghfast.top/https://github.com/hiyouga/LLaMA-Factory.git

git clone https://github.com/hiyouga/LLaMA-Factory.git

cd LLaMA-Factory

source activate llama_factory 

pip install -e .

2、使用

bash 复制代码
# 打开UI页面进行微调
cd /root/autodl-tmp/LLaMA-Factory

source activate llama_factory

llamafactory-cli webui

3、训练设置

将这要训练的数据集丢到/root/autodl-tmp/LLaMA-Factory/data里面
页面上的设置:

调整batch size,让GPU使用达到80%左右

4、llamafactory要求的数据集格式

单论对话

instruction是问,output是回答

多轮对话

instruction是最新一轮的问,output是最新一轮的回答,history是之前的问和回答

input是对instruction数据的补充。

4、查看结果

将训练得到的lora模型,加载到checkpoint里

相关推荐
feasibility.5 天前
多模态模型Qwen3-VL在Llama-Factory中断LoRA微调训练+测试+导出+部署全流程--以具身智能数据集open-eqa为例
人工智能·python·大模型·nlp·llama·多模态·具身智能
aiguangyuan5 天前
使用PyTorch和Hugging Face Transformers构建GPT教学演示:从基础原理到实践应用
人工智能·python·nlp
玄同7656 天前
LangChain v1.0+ Prompt 模板完全指南:构建精准可控的大模型交互
人工智能·语言模型·自然语言处理·langchain·nlp·交互·知识图谱
名为沙丁鱼的猫7297 天前
【MCP 协议层(Protocol layer)详解】:深入分析MCP Python SDK中协议层的实现机制
人工智能·深度学习·神经网络·机器学习·自然语言处理·nlp
桂花很香,旭很美7 天前
基于 MCP 的 LLM Agent 实战:架构设计与工具编排
人工智能·nlp
aoqDrPjNRbKr7 天前
PMSM永磁同步电机无传感器仿真 simulink仿真 SMO滑模观测器 PLL锁相环 无速度...
nlp
玄同7658 天前
告别 AgentExecutor:LangChain v1.0+ Agent 模块深度迁移指南与实战全解析
人工智能·语言模型·自然语言处理·langchain·nlp·agent·智能体
童话名剑8 天前
自然语言处理(吴恩达深度学习笔记)
人工智能·深度学习·机器学习·自然语言处理·nlp·词嵌入
阿龙AI日记9 天前
快速学会BERT模型!
深度学习·自然语言处理·nlp·bert