【linux 安装vllm=0.5.4】

  • 环境

    • linux:ubuntu 22.04
    • cuda:11.8
  • 创建环境

    shell 复制代码
    conda create -n vllm python=3.10
    conda activate vllm
  • 安装ninjia

    shell 复制代码
    sudo apt update
    sudo apt install ninja-build
  • 安装vllm

    shell 复制代码
    pip install vllm
  • 启动openai-server

    shell 复制代码
    VLLM_USE_MODELSCOPE=True vllm serve <model_tag> [--args]
    • <model_tag>:模型id,具体的查看modelscopehuggingface的repo
    • 查看vllm serve有哪些参数可选:vllm serve -h

不要从源码安装,很多的问题!!

相关推荐
不知更鸟3 小时前
前端报错:快速解决Django接口404问题
前端·python·django
4***72133 小时前
【玩转全栈】----Django模板语法、请求与响应
数据库·python·django
梁正雄4 小时前
1、python基础语法
开发语言·python
ituff5 小时前
微软认证考试又免费了
后端·python·flask
郝学胜-神的一滴5 小时前
Linux命名管道:创建与原理详解
linux·运维·服务器·开发语言·c++·程序人生·个人开发
宾有为5 小时前
【Linux】Linux 常用指令
linux·服务器·ssh
wdfk_prog5 小时前
[Linux]学习笔记系列 -- [block]bio
linux·笔记·学习
ajassi20005 小时前
开源 Linux 服务器与中间件(十三)FRP服务器、客户端安装和测试
linux·服务器·开源
梁正雄6 小时前
2、Python流程控制
开发语言·python
XH-hui6 小时前
【打靶日记】群内靶机vm1
linux·网络安全