Qwen2.5 模型使用初体验

yingchenwy2024-09-25 20:07

环境准备

python 复制代码

conda create -n my_vllm python==3.9.19 pip
conda activate my_vllm
pip install modelscope
pip install vllm

模型下载

python 复制代码

# 模型下载
# modelscope默认安装路径：/root/.cache/modelscope/hub/qwen/Qwen2.5-72B-Instruct-GPTQ-Int8
from modelscope import snapshot_download
model_dir = snapshot_download('qwen/Qwen2.5-72B-Instruct-GPTQ-Int8', local_dir='/home/models/qwen/Qwen2.5-72B-Instruct-GPTQ-Int8')

参考文档：

魔搭社区

效率评估 - Qwen

直接服务器vllm启动测试

python 复制代码

vllm serve /home/models/qwen/Qwen2.5-72B-Instruct-GPTQ-Int8 --tensor-parallel-size 2 --max-model-len 256

参考文档：

https://qwen.readthedocs.io/zh-cn/latest/deployment/vllm.html

上一篇：介绍与部署 Zabbix 监控系统

下一篇：从零开始的软件开发详解：数字药店系统源码与医保购药APP