Qwen2.5 模型使用初体验

  1. 环境准备
python 复制代码
conda create -n my_vllm python==3.9.19 pip
conda activate my_vllm
pip install modelscope
pip install vllm
  1. 模型下载
python 复制代码
# 模型下载
# modelscope默认安装路径:/root/.cache/modelscope/hub/qwen/Qwen2.5-72B-Instruct-GPTQ-Int8
from modelscope import snapshot_download
model_dir = snapshot_download('qwen/Qwen2.5-72B-Instruct-GPTQ-Int8', local_dir='/home/models/qwen/Qwen2.5-72B-Instruct-GPTQ-Int8')

参考文档:

魔搭社区

效率评估 - Qwen

  1. 直接服务器vllm启动测试
python 复制代码
vllm serve /home/models/qwen/Qwen2.5-72B-Instruct-GPTQ-Int8 --tensor-parallel-size 2 --max-model-len 256

参考文档:

https://qwen.readthedocs.io/zh-cn/latest/deployment/vllm.html

相关推荐
Dola_Pan11 分钟前
Linux标准IO(五)-I/O缓冲详解
linux·运维·服务器
TeYiToKu15 分钟前
笔记整理—内核!启动!—linux应用编程、网络编程部分(6)随机数与proc文件系统
linux·c语言·arm开发·笔记·嵌入式硬件
cocosum42 分钟前
Centos 7 搭建Samba
linux·运维·服务器·centos
zhyhgx1 小时前
数据链路层之以太网
linux·运维·网络·网络协议·tcp/ip
因缘而起11 小时前
【Linux】当前进展
linux·运维·服务器
小安运维日记1 小时前
Linux云计算 |【第四阶段】PROJECT2-DAY2
linux·运维·云计算
荣世蓥2 小时前
10.1 Linux_并发_进程基本知识
linux·运维·服务器
芝法酱3 小时前
芝法酱学习笔记(0.4)——SpringBoot多模块项目打包,resource分离,lib分离,启动脚本
linux·maven·shell脚本·springboot打包·资源分离
第六五3 小时前
ubuntu如何开启和关闭图形界面
linux·ubuntu·postgresql
机器人梦想家4 小时前
resolvectl和resolvconf的区别及用法(dns问题排查及解决)
linux