SWIFT环境配置及大模型微调实践

weixin_438703902024-03-25 12:34

SWIFT介绍参考：这里

SWIFT环境配置

bash 复制代码

conda create -n swift python=3.8

pip install ms-swift[all] -U

# 下载项目
git clone https://github.com/modelscope/swift

如果是运行qwen-audio，需要安装ffmpeg

bash 复制代码

apt-get update
apt-get install ffmpeg

微调代码

bash 复制代码

cd swift/examples/pytorch/llm
nohup bash scripts/qwen_audio_chat/lora/sft.sh > qwen_audio_chat_sft_20240320.log &

复制代码

   第一次跑，发现使用的是cpu，经过检查，发现pytorch版本对应的cuda版本较高，于是重新安装pytorch。

bash 复制代码

conda install --use-local pytorch-1.13.0-py3.8_cuda11.6_cudnn8.3.2_0.tar.bz2.tar.bz2

复制代码

    但是，在训练的时候会出现问题，如下。

cannot import name 'LRScheduler' from 'torch.optim.lr_scheduler

这个问题定位了很久，最后确定了是版本兼容问题。

具体的：pytorch 2.0.0以上的版本是LRScheduler，以下的版本是_LRScheduler。

卸载掉之前安装的版本，重新手动安装pytorch 2.0.0以上版本。

从该网址下载对应包：https://download.pytorch.org/whl/torch_stable.html
（pytorch的版本号，cuda版本号，python版本号都对应好。）
使用pip手动安装
pip install some_package.whl