Qwen2.5 模型使用初体验

  1. 环境准备
python 复制代码
conda create -n my_vllm python==3.9.19 pip
conda activate my_vllm
pip install modelscope
pip install vllm
  1. 模型下载
python 复制代码
# 模型下载
# modelscope默认安装路径:/root/.cache/modelscope/hub/qwen/Qwen2.5-72B-Instruct-GPTQ-Int8
from modelscope import snapshot_download
model_dir = snapshot_download('qwen/Qwen2.5-72B-Instruct-GPTQ-Int8', local_dir='/home/models/qwen/Qwen2.5-72B-Instruct-GPTQ-Int8')

参考文档:

魔搭社区

效率评估 - Qwen

  1. 直接服务器vllm启动测试
python 复制代码
vllm serve /home/models/qwen/Qwen2.5-72B-Instruct-GPTQ-Int8 --tensor-parallel-size 2 --max-model-len 256

参考文档:

https://qwen.readthedocs.io/zh-cn/latest/deployment/vllm.html

相关推荐
qq_401700417 分钟前
Linux文件锁解决多进程并发
linux·服务器·算法
南棱笑笑生19 分钟前
20251213给飞凌OK3588-C开发板适配Rockchip原厂的Buildroot【linux-6.1】系统时适配type-C0
linux·c语言·开发语言·rockchip
RisunJan1 小时前
Linux命令-gpasswd命令(管理用户组的重要工具)
linux·运维·服务器
where happens2 小时前
centos创建目录并授予权限
linux·运维·服务器·centos
好好学操作系统2 小时前
autodl 保存 数据 跨区
linux·运维·服务器
dbitc2 小时前
WIN11把WSL2移动安装目录
linux·运维·ubuntu·wsl
KingRumn2 小时前
Linux同步机制之信号量
linux·服务器·网络
BullSmall2 小时前
linux 根据端口查看进程
linux·运维·服务器
_F_y3 小时前
Linux:进程间通信
linux
weixin_462446233 小时前
Kali/ubuntu Linux 中彻底删除 Cursor 编辑器(含 dpkg 非空目录警告解决)
linux·ubuntu·cursor