Qwen2.5 模型使用初体验

  1. 环境准备
python 复制代码
conda create -n my_vllm python==3.9.19 pip
conda activate my_vllm
pip install modelscope
pip install vllm
  1. 模型下载
python 复制代码
# 模型下载
# modelscope默认安装路径:/root/.cache/modelscope/hub/qwen/Qwen2.5-72B-Instruct-GPTQ-Int8
from modelscope import snapshot_download
model_dir = snapshot_download('qwen/Qwen2.5-72B-Instruct-GPTQ-Int8', local_dir='/home/models/qwen/Qwen2.5-72B-Instruct-GPTQ-Int8')

参考文档:

魔搭社区

效率评估 - Qwen

  1. 直接服务器vllm启动测试
python 复制代码
vllm serve /home/models/qwen/Qwen2.5-72B-Instruct-GPTQ-Int8 --tensor-parallel-size 2 --max-model-len 256

参考文档:

https://qwen.readthedocs.io/zh-cn/latest/deployment/vllm.html

相关推荐
蜜蜜不吃糖7 分钟前
ESXI主机重置带外密码
linux·运维·服务器
ZhiqianXia30 分钟前
Linux SysRq
linux
Zach_yuan31 分钟前
版本控制器Git
linux·git
Dobby_051 小时前
【Go】C++ 转 Go 第(一)天:环境搭建 Windows + VSCode 远程连接 Linux
linux·运维·c++·vscode·golang
赖small强2 小时前
Linux 页缓存(Page Cache)与回写(Writeback)机制详解
linux·页缓存(page cache)·回写(writeback)·脏页
蓝冰印2 小时前
HarmonyOS Next 快速参考手册
linux·ubuntu·harmonyos
---学无止境---2 小时前
Linux中在字符串中查找指定字符的第一次出现位置的汇编实现
linux
tianyuanwo3 小时前
虚拟机监控全攻略:从基础到云原生实战
linux·云原生·虚机监控
别或许3 小时前
在centos系统下,安装MYSQL
linux·mysql·centos
丁丁丁梦涛3 小时前
CentOS修改MySQL数据目录后重启失败的问题及解决方案
linux·mysql·centos