1. LLaMA-Factory
-
「GitHub」: https://github.com/hiyouga/LLaMA-Factory
-
「特点」:
-
-
支持 100+ 种 LLM 的微调(LLaMA、Mistral、Qwen、ChatGLM 等)
-
提供 WebUI 界面,零代码微调
-
支持 LoRA、QLoRA、全参数微调等多种方法
-
内置数据集处理和评估功能
-
2. PEFT (Parameter-Efficient Fine-Tuning)
-
「GitHub」: https://github.com/huggingface/peft
-
「特点」:
-
-
Hugging Face 官方出品
-
支持 LoRA、Prefix Tuning、P-Tuning、Adapter 等方法
-
与 Transformers 库深度集成
-
显存占用低,适合消费级显卡
-
3. Axolotl
-
「GitHub」: https://github.com/OpenAccess-AI-Collective/axolotl
-
「特点」:
-
-
配置驱动,通过 YAML 文件定义训练流程
-
支持多种模型和微调方法
-
内置 DeepSpeed、FSDP 分布式训练支持
-
4. Unsloth
-
「GitHub」: https://github.com/unslothai/unsloth
-
「特点」:
-
-
训练速度提升 2-5 倍,显存减少 80%
-
支持 LLaMA、Mistral、Gemma 等模型
-
对 QLoRA 优化极佳
-
5. DeepSpeed
-
「GitHub」: https://github.com/microsoft/DeepSpeed
-
「特点」:
-
-
微软出品,专注大规模分布式训练
-
ZeRO 优化器大幅降低显存需求
-
适合超大模型训练
-
6. Swift (ModelScope)
-
「GitHub」: https://github.com/modelscope/swift
-
「特点」:
-
-
阿里达摩院出品
-
对国产模型(Qwen、ChatGLM)支持好
-
提供完整的训练、推理、部署流程
-
快速选择建议
| 场景 | 推荐框架 |
|---|---|
| 新手入门、零代码 | LLaMA-Factory |
| Hugging Face 生态 | PEFT |
| 显存有限、追求速度 | Unsloth |
| 超大规模分布式训练 | DeepSpeed |
| 国产模型微调 | Swift |