大模型微调开源框架推荐

1. LLaMA-Factory

  • 「GitHub」: https://github.com/hiyouga/LLaMA-Factory

  • 「特点」:

    • 支持 100+ 种 LLM 的微调(LLaMA、Mistral、Qwen、ChatGLM 等)

    • 提供 WebUI 界面,零代码微调

    • 支持 LoRA、QLoRA、全参数微调等多种方法

    • 内置数据集处理和评估功能

2. PEFT (Parameter-Efficient Fine-Tuning)

  • 「GitHub」: https://github.com/huggingface/peft

  • 「特点」:

    • Hugging Face 官方出品

    • 支持 LoRA、Prefix Tuning、P-Tuning、Adapter 等方法

    • 与 Transformers 库深度集成

    • 显存占用低,适合消费级显卡

3. Axolotl

4. Unsloth

5. DeepSpeed

6. Swift (ModelScope)

  • 「GitHub」: https://github.com/modelscope/swift

  • 「特点」:

    • 阿里达摩院出品

    • 对国产模型(Qwen、ChatGLM)支持好

    • 提供完整的训练、推理、部署流程


快速选择建议

场景 推荐框架
新手入门、零代码 LLaMA-Factory
Hugging Face 生态 PEFT
显存有限、追求速度 Unsloth
超大规模分布式训练 DeepSpeed
国产模型微调 Swift