大模型微调lama-factory

简介

LLaMA-Factory是一个强大的工具,用于微调大型语言模型。本文将介绍如何使用LLaMA-Factory进行模型微调的简单操作流程,并提供代码记录。

操作流程
  1. 环境搭建

    • 首先,需要克隆LLaMA-Factory仓库并安装必要的库:

      复制代码

      bash

      复制代码
      !git clone https://github.com/hiyouga/LLaMA-Factory.git
      %cd LLaMA-Factory
      %ls
    • 安装unsloth,xformers和bitsandbytes库:

      复制代码

      bash

      复制代码
      !pip install "unsloth[colab-new] @ git+https://github.com/unslothai/unsloth.git"
      !pip install --no-deps xformers==0.0.25
      !pip install .[bitsandbytes]
      !pip install 'urllib3<2'
  2. 数据集准备

    • 将自定义数据集复制到data目录下,并修改data/dataset_info.json以注册数据集:

      复制代码

      json

      复制代码
      {
        "adgen_local": {
          "file_name": "your_dataset.json"
        }
      }
  3. 模型微调

    • 使用LLaMA-Factory的命令行工具进行微调,以下是一个基于LoRA的微调示例命令:

      复制代码

      bash

      复制代码
      CUDA_VISIBLE_DEVICES=0 llamafactory-cli train \
        --stage sft \
        --do_train \
        --model_name_or_path /path/to/your/model \
        --dataset adgen_local \
        --dataset_dir ./data \
        --template llama3 \
        --finetuning_type lora \
        --lora_target q_proj,v_proj \
        --output_dir ./saves/LLaMA3-8B/lora/sft \
        --overwrite_cache \
        --overwrite_output_dir \
        --cutoff_len 1024 \
        --preprocessing_num_workers 16 \
        --per_device_train_batch_size 2 \
        --gradient_accumulation_steps 8 \
        --lr_scheduler_type cosine \
        --logging_steps 50 \
        --warmup_steps 20 \
        --save_steps 100 \
        --eval_steps 50 \
        --evaluation_strategy steps \
        --load_best_model_at_end \
        --learning_rate 5e-5 \
        --num_train_epochs 5.0 \
        --max_samples 1000 \
        --val_size 0.1 \
        --plot_loss \
        --fp16

      参数解释和更多命令可以通过llamafactory-cli train -h获取。

  4. 模型导出

    • 微调完成后,使用以下命令合并LoRA权重到原始模型,并导出新模型:

      复制代码

      bash

      复制代码
      modelPath=/path/to/your/model
      adapterModelPath=./saves/lora/sft/
      llamafactory-cli export \
        --model_name_or_path $modelPath \
        --adapter_name_or_path $adapterModelPath \
        --template qwen \
        --finetuning_type lora \
        --export_dir ./saves/lora/export/ \
        --export_size 2 \
        --export_device cpu \
        --export_legacy_format False
  5. 预测评估

    • 使用微调后的模型进行预测,并评估模型性能:

      复制代码

      bash

      复制代码
      modelPath=/path/to/your/model
      llamafactory-cli train \
        --stage sft \
        --do_predict \
        --finetuning_type lora \
        --model_name_or_path $modelPath \
        --adapter_name_or_path ./saves/lora/sft \
        --template qwen \
        --dataset identity \
        --cutoff_len 4096 \
        --max_samples 20 \
        --overwrite_cache \
        --overwrite_output_dir \
        --per_device_eval_batch_size 1 \
        --preprocessing_num_workers 16 \
        --predict_with_generate
相关推荐
成富9 小时前
Chat Agent UI,类似 ChatGPT 的聊天界面,Spring AI 应用的测试工具
java·人工智能·spring·ui·chatgpt
Sherlock Ma14 小时前
OpenAI新论文!GPT-5-Thinking新训练方法
人工智能·gpt·深度学习·语言模型·自然语言处理·chatgpt·openai
2501_9409758016 小时前
AIGC时代下的论文查重:从工具选择到操作指南
人工智能·chatgpt·aigc
热点速递17 小时前
AI竞争升级:OpenAI在三场“战争”中拉响红色警报,全力聚焦ChatGPT!
人工智能·chatgpt
带刺的坐椅1 天前
Solon AI 开发学习19 - 结合 Solon Flow 实现 ReAct 效果
java·ai·chatgpt·llm·openai·solon·deepseek
kkai人工智能1 天前
谷歌 Gemini 与 OpenAI ChatGPT 的市场竞争格局研究
人工智能·chatgpt
__so__2 天前
OpenAI、Anthropic 和 Google 使用 10 种prompt技术来保证近乎完美的准确率
chatgpt·openai
rockingdingo2 天前
ChatGPT Apps SDK Awesome List ChatGPT开发App SDK的实战例子列表-附代码和连接
chatgpt·chatgpt apps
HillVue2 天前
夸克对话助手,填补了中国版 ChatGPT 的缺口
人工智能·chatgpt·宽度优先·推荐算法