Qwen2.5 模型使用初体验

  1. 环境准备
python 复制代码
conda create -n my_vllm python==3.9.19 pip
conda activate my_vllm
pip install modelscope
pip install vllm
  1. 模型下载
python 复制代码
# 模型下载
# modelscope默认安装路径:/root/.cache/modelscope/hub/qwen/Qwen2.5-72B-Instruct-GPTQ-Int8
from modelscope import snapshot_download
model_dir = snapshot_download('qwen/Qwen2.5-72B-Instruct-GPTQ-Int8', local_dir='/home/models/qwen/Qwen2.5-72B-Instruct-GPTQ-Int8')

参考文档:

魔搭社区

效率评估 - Qwen

  1. 直接服务器vllm启动测试
python 复制代码
vllm serve /home/models/qwen/Qwen2.5-72B-Instruct-GPTQ-Int8 --tensor-parallel-size 2 --max-model-len 256

参考文档:

https://qwen.readthedocs.io/zh-cn/latest/deployment/vllm.html

相关推荐
柳鲲鹏21 分钟前
LINUX下载编译libosmscout
linux·运维·服务器
czxyvX30 分钟前
018-Linux-Socket编程-UDP
linux·udp
十五年专注C++开发32 分钟前
tiny-process-library:一个用 C++ 编写的轻量级、跨平台(支持 Windows、Linux、macOS)的进程管理库
linux·c++·windows·进程管理
学不完的32 分钟前
Nginx
linux·运维·nginx·运维开发
汇智信科32 分钟前
汇智信科网络考试系统:以技术赋能,重构在线测评新范式
linux·数据库·mysql·oracle·sqlserver·java技术
码农编程录33 分钟前
【notes14】debugfs
linux
数据与人33 分钟前
Linux中Too many open files错误的解决
linux·服务器·前端
Joren的学习记录35 分钟前
【Linux运维大神系列】k8s项目部署实战
linux·运维·kubernetes
杰克崔36 分钟前
android的lmkd的实现及代码分析
android·linux·运维·服务器·车载系统
Codefengfeng37 分钟前
webshell流量分析-Practice1
linux·web安全