【模型手术室】第四篇:全流程实战 —— 使用 LLaMA-Factory 开启你的第一个微调任务

专栏进度:04 / 10 (微调实战专题)

很多初学者卡在环境配置和复杂的 torch.train 逻辑上。LLaMA-Factory 的核心优势在于它集成了几乎所有主流国产模型(DeepSeek, Qwen, Yi)和海外模型(Llama 3, Mistral),并且原生支持 Gradio 可视化面板,让你在网页上点点鼠标就能"炼丹"。

一、 环境搭建:打造你的"炼丹炉"

为了保证训练不因版本冲突而崩溃,建议使用 Conda 进行物理隔离。

Bash

  1. 克隆项目

git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git

cd LLaMA-Factory

  1. 安装核心依赖 (针对 CUDA 12.1 环境)

pip install -e .metrics,bitsandbytes,qwen

  1. 验证是否安装成功

llamafactory-cli version

二、 准备食材:注册你的"行业黑话"数据集

LLaMA-Factory 有一套自己的数据集管理逻辑。你需要把上一篇生成的 security_expert_data.jsonl 放入 data/ 目录,并在 data/dataset_info.json 中注册它。

注册示例:

JSON

"my_security_data": {

"file_name": "security_expert_data.jsonl",

"columns": {

"prompt": "instruction",

"query": "input",

"response": "output"

}

}

三、 点火炼丹:WebUI 模式与脚本模式

  1. 初学者推荐:WebUI 模式
    在终端执行 llamafactory-cli webui。
    你会看到一个极其直观的界面。你需要设置:

模型名称:选择 DeepSeek-V3 或 Qwen2.5-7B。

微调方法:选择 lora。

数据集:勾选你刚刚注册的 my_security_data。

学习率:建议 5e-5。

计算精度:显存够选 bf16,不够选 fp16 或 int4。

  1. 高阶推荐:命令行模式 (CLI)
    一旦参数调优确定,建议使用脚本运行,更稳定且方便记录。

Bash

llamafactory-cli train

--stage sft

--do_train

--model_name_or_path /path/to/your/model

--dataset my_security_data

--template qwen

--finetuning_type lora

--output_dir ./saves/security_agent_v1

--per_device_train_batch_size 4

--gradient_accumulation_steps 4

--lr_scheduler_type cosine

--logging_steps 10

--save_steps 100

--learning_rate 5e-5

--num_train_epochs 3.0

--plot_loss

--fp16

四、 关键指标:如何看懂"炼丹炉"里的 Loss 曲线

在训练过程中,你会看到一个不断下降的 Loss(损失值) 曲线。

理想曲线:平稳下降,最后在某个数值(如 0.5 - 1.2 之间)开始横向震荡。

警报曲线:Loss 突然降到 0(过拟合,模型只会背书)或者 Loss 突然飙升(梯度爆炸,模型疯了)。

对策:如果 Loss 不降,调大 learning_rate;如果 Loss 波动太大,调小 learning_rate 并增大 batch_size。

五、 避坑指南:显存溢出的"救命稻草"

如果你运行报错 OutOfMemoryError:

开启量化:使用 --quantization_bit 4。

降低长度:将 --cutoff_len 从 1024 降到 512。

梯度检查点:确保开启了 --gradient_checkpointing。

相关推荐
tjsoft19 小时前
第四封信:谈人工智能时代的教育
人工智能
guslegend19 小时前
第4讲:应用架构与代码组织
数据结构·人工智能·架构
@我们的天空19 小时前
Claude Code + GLM-5 深度赋能测试:开发 8 大 Skill 构建 AI 测试助手集群
人工智能·python·测试工具·自动化·ai编程
联通权斌19 小时前
23个咨询单,关于运营商、智算和AI
人工智能
摄影图19 小时前
[图片素材]国产芯片半导体 满足科技创作多场景需求
人工智能·科技·aigc·贴图·插画
音视频牛哥20 小时前
具身智能进入深水区:特斯拉闭环、国产机器人突围与场景价值重构
人工智能·agi·机器视觉·具身智能·特斯拉和宇树科技·特斯拉optimus·具身智能发展困境
机器学习之心20 小时前
上海原油期货收益率研究数据集说明
大数据·人工智能·上海原油期货收益率
计算机安禾20 小时前
【算法分析与设计】第19篇:二分图匹配与指派问题
大数据·人工智能·算法
小白学大数据20 小时前
Playwright 爬虫:Python 爬取 JS 渲染的 JSP 网站
开发语言·javascript·爬虫·python·数据分析
rannn_11120 小时前
OpenAI Function Calling 全解析:从函数定义到流式调用
人工智能·chatgpt·openai·ai agent