LLaMA Factory 是一个简单易用且高效的大型语言模型(Large Language Model)训练与微调平台。官网:GitHub - hiyouga/LLaMA-Factory: Unified Efficient Fine-Tuning of 100+ LLMs & VLMs (ACL 2024)
快速入门教程:LLaMA-Factory QuickStart - 知乎
LLaMA Factory作为当前主流的大模型微调框架,其核心价值在于通过模块化设计降低技术门槛,主要特性包括:
一、核心架构设计
- 统一接口支持LoRA/QLoRA等9种参数高效微调方法,用户通过YAML配置即可切换不同算法
- 内置FlashAttention-2和Unsloth优化技术,训练速度较传统方法提升3.7倍
- 采用PD分离式部署方案,支持单卡部署千亿参数模型
二、关键功能模块
- 模型支持:覆盖LLaMA3、Qwen、ChatGLM等127个开源模型
- 训练方法:集成PPO/DPO/ORPO等强化学习流程
- 量化方案:提供2-8bit多种精度选择,显存占用降低80%
三、典型应用场景
- 领域适配:通过指令微调注入专业知识,ROUGE分数提升42%
- 多模态训练:支持LLaVA等视觉语言联合微调15
- 边缘部署:4bit量化后可在RTX 4090实现百万级日请求
该框架通过LlamaBoard可视化界面实现零代码操作,同时保留API供开发者深度定制26。在广告文本生成任务中,其微调效果超越传统P-Tuning方法。
手边没有合适的机器,就不先实践了。