基于LLaMA-Factory大语言模型微调实战-训练一个属于自己的大模型

第一章 LLaMA-Factory安装及SFT微调

LLaMA-Factory 安装

运行以下指令以安装 LLaMA-Factory 及其依赖:

powershell 复制代码
git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git
cd LLaMA-Factory
pip install -e ".[torch,metrics]"

如果出现环境冲突,请尝试使用 pip install --no-deps -e . 解决

下载模型

在魔塔社区下载Qwen2.5-0.5B-Instruct模型

复制代码
git clone https://www.modelscope.cn/Qwen/Qwen2.5-0.5B-Instruct.git

SFT微调

微调命令

复制代码
llamafactory-cli train examples/train_lora/qwen2.5_lora_sft.yaml

说明:examples/train_lora/qwen2.5_lora_sft.yaml是LLaMA-Factory文件夹下面的相对文件路径;

qwen2.5_lora_sft.yaml文件内容

txt 复制代码
### model
# model_name_or_path:本地下载模型存放的绝对路径
### model
model_name_or_path: /mnt/workspace/models/Qwen2.5-0.5B-Instruct
trust_remote_code: true

### method 
stage: sft
do_train: true
finetuning_type: lora
lora_rank: 8
lora_target: all

### dataset数据集
dataset: identity
template: qwen
cutoff_len: 2048
max_samples: 1000
overwrite_cache: true
preprocessing_num_workers: 16
dataloader_num_workers: 4

### output 微调后模型存放的位置
output_dir: saves/Qwen2.5-0.5B-Instruct/lora/sft-2026-01-14-01
logging_steps: 10
save_steps: 500
plot_loss: true
overwrite_output_dir: true
save_only_model: false
report_to: none  # choices: [none, wandb, tensorboard, swanlab, mlflow]

### train
per_device_train_batch_size: 1
gradient_accumulation_steps: 8
learning_rate: 1.0e-4
num_train_epochs: 3.0
lr_scheduler_type: cosine
warmup_ratio: 0.1
bf16: true
ddp_timeout: 180000000
resume_from_checkpoint: null

### eval
# eval_dataset: alpaca_en_demo
# val_size: 0.1
# per_device_eval_batch_size: 1
# eval_strategy: steps
# eval_steps: 500

重要训练参数说明

数据集参数说明:

dataset: identity,identity是数据集json文件的名称,需要配置在/LLaMA-Factory/data/dataset_info.json文件中

identify.json文件路径为/LLaMA-Factory/data/identify.json,如下截图

微调过程截图

训练损失变化图

观察与分析

从 step 10 到 step 30,smoothed 曲线​ 从 loss ≈ 2.6 持续下降至 ≈ 1.4,表明模型在学习过程中逐步优化,微调有效。

相关推荐
无心水20 小时前
【分布式利器:SOAF】蚂蚁开源的金融级微服务全家桶:SOFAStack 核心架构与实战选型对比
人工智能·分布式·微服务·金融·架构·开源·分布式利器
梧桐和风20 小时前
2026 年 Java 趋势:AI 浪潮下,Java 会过时吗?
java·开发语言·人工智能
jianwuhuang8220 小时前
智谱清言怎么导出pdf
人工智能·chatgpt·pdf·豆包·deepseek·ai导出鸭
数智前线20 小时前
腾讯云融合创新产品矩阵全面升级,首次发布专有云版“龙虾”
大数据·人工智能
青云计划20 小时前
给 AI 写一份老厨师的菜谱:从传统文档到 Skill 知识体系
人工智能
Luminbox紫创测控20 小时前
基于环境舱的新能源汽车三高试验方法与热响应评估
大数据·人工智能·测试工具·汽车·安全性测试·测试标准
码小猿的CPP工坊20 小时前
AI时代C++软件开发工程师的思考
c++·人工智能
AI布道师-wang20 小时前
第 6 章:Prompt 工程——和模型高效沟通
人工智能·机器学习·prompt
老王谈企服20 小时前
AI Agent将如何重构制造业的安全生产隐患识别模式?深度理解与实在Agent闭环实战
人工智能·安全·ai·重构
枫叶林FYL20 小时前
【机器学习与智慧医疗】糖尿病视网膜病变视力丧失预测:贝叶斯估计与威布尔分布
大数据·人工智能·机器学习