【ms-swift 大模型微调实战】

安装环境

下载模型

  • modelscope download --model Qwen/Qwen2.5-7B-Instruct --local_dir ./Qwen2.5-7B-Instruct

微调

  • 实验环境:4 * A100# 显存占用:4 * 70GB

      NPROC_PER_NODE=4 CUDA_VISIBLE_DEVICES=0,1,2,3 swift sft \
          --model_type qwen2_5-72b-instruct \
          --model_id_or_path Qwen2.5-72B-Instruct \
          --dataset qwen2-pro-en#500 qwen2-pro-zh#500 self-cognition#500 \
          --logging_steps 5 \
          --learning_rate 1e-4 \
          --output_dir output \ 
          --lora_target_modules ALL \
          --model_name 小黄 'Xiao Huang' \
          --model_author 魔搭 ModelScope \
          --deepspeed default-zero3
    
  • 单卡A10/3090可运行的例子 (Qwen2.5-7B-Instruct)# 显存占用:24GB

    	CUDA_VISIBLE_DEVICES=0 swift sft \
      --model_type qwen2_5-7b-instruct \
      --model_id_or_path Qwen2.5-7B-Instruct \
      --dataset qwen2-pro-en#500 qwen2-pro-zh#500 self-cognition#500 \
      --logging_steps 5 \
      --max_length 2048 \
      --learning_rate 1e-4 \
      --output_dir output \
      --lora_target_modules ALL \
      --model_name 小黄 'Xiao Huang' \
      --model_author 魔搭 ModelScope
    

融合lora

CUDA_VISIBLE_DEVICES=0,1 swift export \    
        --ckpt_dir output/qwen2_5-72b-instruct/vx-xxx/checkpoint-xxx \    
        --merge_lora true

vLLM部署

vllm serve xxxxx-checkpoint-merged [opentional args]

参考

相关推荐
AI_小站5 天前
MedSAM微调版,自动生成 Prompt 嵌入实现图像分割!
人工智能·ai·语言模型·langchain·大模型·prompt·大模型微调
人工智能培训咨询叶梓5 天前
语言模型微调:提升语言Agent性能的新方向
人工智能·深度学习·语言模型·自然语言处理·性能优化·调优·1024程序员节·大模型微调
人工智能培训咨询叶梓7 天前
语言模型与人类反馈的深度融合:Chain of Hindsight技术
人工智能·深度学习·语言模型·自然语言处理·性能优化·强化学习·大模型微调
人工智能培训咨询叶梓10 天前
自我指导:提升语言模型自我生成指令的能力
人工智能·语言模型·自然语言处理·性能优化·调优·大模型微调·指令微调
人工智能培训咨询叶梓12 天前
使用LLaMA-Factory快速训练自己的专用大模型
人工智能·语言模型·性能优化·llama·调优·大模型微调·llama-factory
python_知世12 天前
垂直领域的大模型应该如何构建?RAG还是微调呢?
人工智能·搜索引擎·大模型·大语言模型·ai大模型·rag·大模型微调
少喝冰美式17 天前
大模型微调实战:基于 LLaMAFactory 通过 LoRA 微调修改模型自我认知
数据库·人工智能·lora·llama·大模型实战·大模型微调·大模型应用
人工智能培训咨询叶梓1 个月前
参数高效的迁移学习在自然语言处理中的应用
人工智能·自然语言处理·性能优化·微调·迁移学习·大模型微调
Cc不爱吃洋葱1 个月前
一文详解大模型微调与小模型训练
自然语言处理·大模型·llm·微调·大语言模型·大模型微调·小模型训练