vllm的部署和使用

conda create -n cosyvoice python=3.10.9 cudnn=9.1.1.17 nvidia/label/cuda-12.1.1::cuda-toolkit ffmpeg x264

pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121

pip install vllm==0.6.6

pip install transformers==4.46 modelscope==1.20.1

qwen2.5模型下载

from modelscope import snapshot_download

Downloading model checkpoint to a local dir model_dir

model_dir = snapshot_download('Qwen/Qwen2.5-0.5B-Instruct')

model_dir = snapshot_download('Qwen/Qwen2.5-7B-Instruct')

model_dir = snapshot_download('Qwen/Qwen2.5-32B-Instruct')

model_dir = snapshot_download('Qwen/Qwen2.5-72B-Instruct')

model_dir = snapshot_download('Qwen/Qwen2.5-1.5B-Instruct')

相关推荐
小胡说人工智能18 天前
深度剖析:Dify+Sanic+Vue+ECharts 搭建 Text2SQL 项目 sanic-web 的 Debug 实战
人工智能·python·llm·text2sql·dify·vllm·ollama
奔跑中的小象22 天前
基于 nvitop+Prometheus+Grafana 的物理资源与 VLLM 引擎服务监控方案
grafana·prometheus·vllm·nvitop
为啥全要学1 个月前
vLLM部署Qwen2-7B模型推理
python·langchain·vllm
Nicolas8931 个月前
【大模型实战篇】华为信创环境采用vllm部署QwQ-32B模型
华为·信创·模型部署·昇腾·ascend·vllm·模型推理
engchina1 个月前
来自B站AIGC科技官的“vLLM简介“视频截图
人工智能·vllm
C7211BA1 个月前
为什么vllm能够加快大模型推理速度?
大语言模型·vllm
HyperAI超神经2 个月前
【vLLM 学习】Aqlm 示例
java·开发语言·数据库·人工智能·学习·教程·vllm
人肉推土机2 个月前
大模型量化实战:GPTQ与AWQ量化方案对比与部署优化
vllm·gptq·awq·大模型量化
Amor风信子2 个月前
【大模型微调】如何解决llamaFactory微调效果与vllm部署效果不一致如何解决
人工智能·学习·vllm
Silence4Allen2 个月前
Ubuntu 22.04 AI大模型环境配置及常用工具安装
ubuntu·vllm·ollama·llama-factory·openwebui·lmdeploy