Qwen2.5 模型使用初体验

  1. 环境准备
python 复制代码
conda create -n my_vllm python==3.9.19 pip
conda activate my_vllm
pip install modelscope
pip install vllm
  1. 模型下载
python 复制代码
# 模型下载
# modelscope默认安装路径:/root/.cache/modelscope/hub/qwen/Qwen2.5-72B-Instruct-GPTQ-Int8
from modelscope import snapshot_download
model_dir = snapshot_download('qwen/Qwen2.5-72B-Instruct-GPTQ-Int8', local_dir='/home/models/qwen/Qwen2.5-72B-Instruct-GPTQ-Int8')

参考文档:

魔搭社区

效率评估 - Qwen

  1. 直接服务器vllm启动测试
python 复制代码
vllm serve /home/models/qwen/Qwen2.5-72B-Instruct-GPTQ-Int8 --tensor-parallel-size 2 --max-model-len 256

参考文档:

https://qwen.readthedocs.io/zh-cn/latest/deployment/vllm.html

相关推荐
cui_ruicheng几秒前
Linux线程(三):线程同步、互斥与生产者消费者模型
linux·服务器·开发语言
信看7 分钟前
CM4 网口排查步骤
linux
小杍随笔1 小时前
【WordPress 核心表】
linux·运维·服务器
TEC_INO1 小时前
Linux_55:RV1126的VENC模块讲解
linux·网络·人工智能
mounter6251 小时前
比 veth 更强、为 eBPF 而生:深度解析 Linux netkit 虚拟网卡驱动
linux·ebpf·kernel·netkit
用户2367829801681 小时前
Linux du 命令深度解析:从磁盘占用统计到目录空间分析
linux
H Journey1 小时前
网络编程:Linux下高性能TCP网络服务器(代码完整版)多线程版本
linux·服务器·网络
码云骑士1 小时前
jwt入门介绍
linux·运维·数据库
灵晔君2 小时前
【Linux】进程(一)
linux·运维·服务器
李日灐2 小时前
< 9 > Linux 进程:进程状态 + 进程切换 + 附带常用指令(jobs / fg / kill / ps)
linux·运维·服务器·后端·面试·进程状态