ubuntu 18 cuda 11.8 安装 vllm

根据官方文档

复制代码
# Install vLLM with CUDA 11.8.
export VLLM_VERSION=0.4.0
export PYTHON_VERSION=310
pip install https://github.com/vllm-project/vllm/releases/download/v${VLLM_VERSION}/vllm-${VLLM_VERSION}+cu118-cp${PYTHON_VERSION}-cp${PYTHON_VERSION}-manylinux1_x86_64.whl --extra-index-url https://download.pytorch.org/whl/cu118

安装后启动

复制代码
python -m vllm.entrypoints.openai.api_server \
    --model Qwen/Qwen2-7B-Instruct \
    --tensor-parallel-size 2 \
    --port 9191

报错

复制代码
Failed to import NCCL library: libnccl.so.2: cannot open shared object file: No such file or directory

需要安装官方nccl

https://developer.nvidia.com/nccl/nccl-legacy-downloads

复制代码
wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/cuda-keyring_1.0-1_all.deb
sudo dpkg -i cuda-keyring_1.0-1_all.deb
sudo apt-get update


sudo apt install libnccl2=2.15.5-1+cuda11.8 libnccl-dev=2.15.5-1+cuda11.8
相关推荐
RDCJM几秒前
Linux下MySQL的简单使用
linux·mysql·adb
ljh5746491192 分钟前
linux sed 命令
linux·运维·服务器
wbs_scy2 分钟前
Linux 进程间通信之管道基础解析 —— 匿名管道的原理与实现
linux·运维·服务器
牛马鸡niumasi6 分钟前
Linux: zip/tar/scp
linux
无限进步_6 分钟前
深入解析C++容器适配器:stack、queue与deque的实现与应用
linux·开发语言·c++·windows·git·github·visual studio
IMPYLH8 分钟前
Linux 的 basename 命令
linux·运维·服务器·ssh·bash
EnCi Zheng9 分钟前
Linux基础技术专栏
linux·运维·服务器
糟糕喔13 分钟前
k8s运维-亲和(5)
运维·容器·kubernetes
淮北49418 分钟前
linux下终端不动,检测进程的状态
linux·运维·服务器
芥子沫25 分钟前
有声书应用Audiobookshelf:Docker一键部署教程和使用指南
运维·docker·容器