Ubuntu 22.04完整安装Xinference及解决依赖报错

注:文中使用的环境为Ubuntu 22.04 LTS + CUDA 12.4.1

1、创建conda环境

shell 复制代码
conda create -n xinference python==3.11 -y
conda activate xinference

2、安装Xinference

shell 复制代码
pip install "xinference[all]"

3、解决报错

Pytorch报错

根据Pytorch安装指引进行安装,重新执行命令即可。注意,一定要在Pytorch网站上按照你的系统和CUDA版本等选择。使用pip即可。例:

shell 复制代码
pip3 install torch torchvision torchaudio
pip install "xinference[all]"

llama-cpp-python报错

当报错ERROR: Failed building wheel for llama-cpp-python时,需要手动修补环境并重新安装llama-cpp-python。这个问题比较复杂。按步骤操作即可修复:

  • 修复构建工具链

    shell 复制代码
    sudo add-apt-repository ppa:ubuntu-toolchain-r/test
    sudo apt update
    sudo apt install gcc-11 g++-11
    sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-11 60 --slave /usr/bin/g++ g++ /usr/bin/g++-11
    pip install --upgrade pip
    pip install --upgrade setuptools wheel
    sudo apt-get install build-essential
    sudo apt-get install libgomp1
  • 检查并更新环境变量

    shell 复制代码
    export PATH=/usr/local/cuda-12.4/bin:$PATH
    export LD_LIBRARY_PATH=/usr/local/cuda-12.4/lib64:/usr/local/cuda-12.4/extras/CUPTI/lib64:/usr/local/cuda-12.4/targets/x86_64-linux/lib:/usr/lib/x86_64-linux-gnu:$LD_LIBRARY_PATH
  • 重新安装

    shell 复制代码
    # CPU推理
    pip install llama-cpp-python --verbose
    # N卡推理
    CMAKE_ARGS="-DLLAMA_CUBLAS=on" FORCE_CMAKE=1 pip install --upgrade --force-reinstall llama-cpp-python==0.2.57 --no-cache-dir --verbose
    pip install "xinference[all]"
相关推荐
进击的阿尔法猿11 分钟前
docker
运维·docker·容器
yuxb7315 分钟前
Linux 文本处理与 Shell 编程笔记:正则表达式、sed、awk 与变量脚本
linux·笔记·正则表达式
北京阿法龙科技有限公司20 分钟前
AR 虚实叠加技术在工业设备运维中的实现流程方案
运维·ar
刘一说26 分钟前
CentOS 系统 Java 开发测试环境搭建手册
java·linux·运维·服务器·centos
wdxylb6 小时前
云原生俱乐部-shell知识点归纳(1)
linux·云原生
飞雪20077 小时前
Alibaba Cloud Linux 3 在 Apple M 芯片 Mac 的 VMware Fusion 上部署的完整密码重置教程(二)
linux·macos·阿里云·vmware·虚拟机·aliyun·alibaba cloud
路溪非溪7 小时前
关于Linux内核中头文件问题相关总结
linux
木易双人青8 小时前
01-Docker-简介、安装与使用
运维·docker·容器
专注API从业者9 小时前
Python + 淘宝 API 开发:自动化采集商品数据的完整流程
大数据·运维·前端·数据挖掘·自动化
Lovyk10 小时前
Linux 正则表达式
linux·运维