大模型微调lama-factory

简介

LLaMA-Factory是一个强大的工具,用于微调大型语言模型。本文将介绍如何使用LLaMA-Factory进行模型微调的简单操作流程,并提供代码记录。

操作流程
  1. 环境搭建

    • 首先,需要克隆LLaMA-Factory仓库并安装必要的库:

      复制代码

      bash

      !git clone https://github.com/hiyouga/LLaMA-Factory.git
      %cd LLaMA-Factory
      %ls
      
    • 安装unsloth,xformers和bitsandbytes库:

      复制代码

      bash

      !pip install "unsloth[colab-new] @ git+https://github.com/unslothai/unsloth.git"
      !pip install --no-deps xformers==0.0.25
      !pip install .[bitsandbytes]
      !pip install 'urllib3<2'
      
  2. 数据集准备

    • 将自定义数据集复制到data目录下,并修改data/dataset_info.json以注册数据集:

      复制代码

      json

      {
        "adgen_local": {
          "file_name": "your_dataset.json"
        }
      }
      
  3. 模型微调

    • 使用LLaMA-Factory的命令行工具进行微调,以下是一个基于LoRA的微调示例命令:

      复制代码

      bash

      CUDA_VISIBLE_DEVICES=0 llamafactory-cli train \
        --stage sft \
        --do_train \
        --model_name_or_path /path/to/your/model \
        --dataset adgen_local \
        --dataset_dir ./data \
        --template llama3 \
        --finetuning_type lora \
        --lora_target q_proj,v_proj \
        --output_dir ./saves/LLaMA3-8B/lora/sft \
        --overwrite_cache \
        --overwrite_output_dir \
        --cutoff_len 1024 \
        --preprocessing_num_workers 16 \
        --per_device_train_batch_size 2 \
        --gradient_accumulation_steps 8 \
        --lr_scheduler_type cosine \
        --logging_steps 50 \
        --warmup_steps 20 \
        --save_steps 100 \
        --eval_steps 50 \
        --evaluation_strategy steps \
        --load_best_model_at_end \
        --learning_rate 5e-5 \
        --num_train_epochs 5.0 \
        --max_samples 1000 \
        --val_size 0.1 \
        --plot_loss \
        --fp16
      

      参数解释和更多命令可以通过llamafactory-cli train -h获取。

  4. 模型导出

    • 微调完成后,使用以下命令合并LoRA权重到原始模型,并导出新模型:

      复制代码

      bash

      modelPath=/path/to/your/model
      adapterModelPath=./saves/lora/sft/
      llamafactory-cli export \
        --model_name_or_path $modelPath \
        --adapter_name_or_path $adapterModelPath \
        --template qwen \
        --finetuning_type lora \
        --export_dir ./saves/lora/export/ \
        --export_size 2 \
        --export_device cpu \
        --export_legacy_format False
      
  5. 预测评估

    • 使用微调后的模型进行预测,并评估模型性能:

      复制代码

      bash

      modelPath=/path/to/your/model
      llamafactory-cli train \
        --stage sft \
        --do_predict \
        --finetuning_type lora \
        --model_name_or_path $modelPath \
        --adapter_name_or_path ./saves/lora/sft \
        --template qwen \
        --dataset identity \
        --cutoff_len 4096 \
        --max_samples 20 \
        --overwrite_cache \
        --overwrite_output_dir \
        --per_device_eval_batch_size 1 \
        --preprocessing_num_workers 16 \
        --predict_with_generate
      
相关推荐
小二·1 小时前
革命性AI搜索引擎!ChatGPT最新功能发布,无广告更智能!
人工智能·搜索引擎·chatgpt
爱技术的小伙子19 小时前
【ChatGPT】 让ChatGPT模拟客户服务对话与应答策略
人工智能·chatgpt
fly-971 天前
LLM大模型微调入门Lora(LlamaFactory)
chatgpt·nlp
程序员洲洲2 天前
重构开发之道,Blackbox.AI为技术注入智能新动力
chatgpt·blackbox.ai·blackboxai·图片转应用
海边散步的蜗牛2 天前
学术论文写作丨机器学习与深度学习
人工智能·深度学习·机器学习·chatgpt·数据分析·ai写作
爱技术的小伙子2 天前
【ChatGPT】通过Prompt技巧优化ChatGPT的营销文案输出
人工智能·chatgpt·prompt
智匠MindCraft Al2 天前
GPT o1 模型使用及API调用
人工智能·gpt·ai·语言模型·chatgpt
HelpLook HelpLook2 天前
人工智能:重塑医疗、企业与生活的未来知识管理——以HelpLook为例
人工智能·chatgpt·生活·知识库·helplook·知识库搭建
tyler_download2 天前
手撸 chatgpt 大模型:简述 LLM 的架构,算法和训练流程
算法·chatgpt