linux(ubuntu)中Conda、CUDA安装Xinference报错ERROR: Failed to build (llama-cpp-python)

文章目录

如果符合标题情况

执行的:

bash 复制代码
pip install "xinference[all]"

大概率是最终解决的情况。


一、常规办法

llama-cpp-python 依赖 CMakeMakeg++ 来编译,所以可能是 缺少依赖 或者 环境配置不对。按照以下步骤排查问题并解决:


1. 确保 Python 版本符合要求
llama-cpp-python 需要 Python >=3.8 ,推荐 Python 3.10 或更高:

sh 复制代码
python --version

如果 Python 版本低于 3.8,建议升级。

如果使用 conda

sh 复制代码
conda create -n xinference_env python=3.10
conda activate xinference_env

2. 安装必要的依赖

如果你在 Ubuntu / Debian

sh 复制代码
sudo apt update
sudo apt install -y cmake make g++ python3-dev

如果你在 CentOS / RHEL

sh 复制代码
sudo yum install -y cmake make gcc-c++ python3-devel

如果你在 macOS

sh 复制代码
brew install cmake

3. 重新尝试安装

使用 pip 重新安装:

sh 复制代码
pip install --no-cache-dir llama-cpp-python

或者 强制重新编译

sh 复制代码
CMAKE_ARGS="-DLLAMA_CUBLAS=on" pip install --force-reinstall --no-cache-dir llama-cpp-python

如果你有 NVIDIA GPU 并希望使用 CUDA 加速:

sh 复制代码
CMAKE_ARGS="-DLLAMA_CUBLAS=on" pip install llama-cpp-python --no-cache-dir

4. 检查 pip 是否最新

有时 pip 版本太旧会导致安装失败:

sh 复制代码
pip install --upgrade pip setuptools wheel

5. 使用 Prebuilt 版本(跳过编译)

如果仍然失败,可以安装 预编译版本

sh 复制代码
pip install llama-cpp-python --prefer-binary

总结

检查 Python 版本 (python --version)

安装依赖 (sudo apt install cmake make g++ python3-dev)

清除缓存并强制重新安装 (pip install --no-cache-dir llama-cpp-python)

尝试 CUDA 版本 (如果有 GPU)

使用预编译版本 (pip install llama-cpp-python --prefer-binary)


二、继续

在这种情况下,通常是因为构建环境的某些依赖或版本不满足要求。请按照以下步骤逐项排查和解决问题:

1. 升级构建工具和 Python 打包工具

确保你的 pip、setuptools 和 wheel 均为最新版本:

sh 复制代码
pip install --upgrade pip setuptools wheel

2. 检查 CMake 版本

低版本的 CMake 可能导致编译失败。请确认你的 CMake 至少在 3.18 以上:

sh 复制代码
cmake --version

如果版本较低,建议更新 CMake:

  • 使用 Snap 安装最新版本:

    sh 复制代码
    sudo snap install cmake --classic
  • 或者从 CMake 官网 下载最新二进制包并安装。


3. 检查 g++ 编译器版本

llama-cpp-python 需要支持 C++17。请确保 g++ 版本足够新(推荐 g++ 9 或更高):

sh 复制代码
g++ --version

如果版本过低,安装 g+±9(或更高版本):

sh 复制代码
sudo apt install g++-9

并通过 update-alternatives 设置默认 g++:

sh 复制代码
sudo update-alternatives --install /usr/bin/g++ g++ /usr/bin/g++-9 90

4. 配置 CUDA 环境变量

既然你已经安装了 CUDA,请确保环境变量正确设置,特别是 CUDA_HOME(这有助于 CMake 定位 CUDA 库):

sh 复制代码
export CUDA_HOME=/usr/local/cuda
export PATH=$CUDA_HOME/bin:$PATH
export LD_LIBRARY_PATH=$CUDA_HOME/lib64:$LD_LIBRARY_PATH

你可以将这些配置添加到 ~/.bashrc~/.profile 中以便永久生效。


5. 尝试详细日志安装

使用更详细的日志输出安装,以便获取具体错误信息:

sh 复制代码
pip install --no-cache-dir llama-cpp-python -v

观察输出日志,确认是否有其他缺失的依赖或编译错误提示。


6. 从源码安装

如果通过 pip 直接安装仍然失败,尝试从源码克隆并安装:

sh 复制代码
git clone https://github.com/abetlen/llama-cpp-python.git
cd llama-cpp-python
pip install .

这样可以获得更多编译过程中的详细信息,有助于定位问题。


三、继续

错误日志可能问题出在 CMake 无法找到 vendor/llama.cpp 目录下应有的 CMake 配置文件,以及 llava 相关子目录缺失。这通常有两种原因:

  1. 源码包缺失子模块内容

    如果你直接通过 pip 安装,而源码包中未包含子模块(即 vendor/llama.cpp 及其子目录),就会导致构建失败。解决方案是从 GitHub 克隆仓库时使用 --recursive 选项,确保拉取所有子模块内容,然后再安装。例如:

    bash 复制代码
    git clone --recursive https://github.com/abetlen/llama-cpp-python.git
    cd llama-cpp-python
    pip install .
  2. 不需要构建 llava 支持

    错误日志显示构建过程中试图添加 llava 相关目标,但对应目录缺失。如果你不需要 llava(通常用于特定扩展功能),可以在编译时禁用它。尝试在安装时传递 CMake 参数关闭 llava 模块:

    bash 复制代码
    CMAKE_ARGS="-DLLAMA_CPP_BUILD_LLAVA=OFF" pip install --no-cache-dir llama-cpp-python

    这样可以跳过对不存在目录的引用。


综合建议

  • 方案一:从源码克隆并安装(推荐用于 CUDA 支持)

    通过 Git 克隆完整仓库(包含子模块)再安装:

    bash 复制代码
    git clone --recursive https://github.com/abetlen/llama-cpp-python.git
    cd llama-cpp-python
    pip install .
  • 方案二:禁用 llava 模块重新编译

    如果你确定不需要 llava 支持,可以禁用它:

    bash 复制代码
    CMAKE_ARGS="-DLLAMA_CPP_BUILD_LLAVA=OFF" pip install --no-cache-dir llama-cpp-python

四、缺少 libgomp库

从错误日志来看,构建过程中链接 libggml-cpu.so 时缺失 OpenMP 运行时库(libgomp.so.1),导致一系列 GOMP_* 符号无法解析。这通常表明当前系统中缺少 GNU OpenMP 库。

为解决此问题,请依次执行以下步骤:

  1. 安装 libgomp 库

    在 Ubuntu 系统中,通常可以通过以下命令安装 libgomp:

    bash 复制代码
    sudo apt-get update
    sudo apt-get install libgomp1

    如果需要开发头文件,也可以安装:

    bash 复制代码
    sudo apt-get install libgomp-dev
  2. 验证库路径

    安装后,确认 libgomp.so.1 存在于系统库目录(如 /usr/lib/x86_64-linux-gnu/):

    bash 复制代码
    locate libgomp.so.1

    或者:

    bash 复制代码
    find /usr -name "libgomp.so.1"
  3. 确保编译器调用正确的 OpenMP 链接标志

    如果依然报错,请检查是否需要在编译参数中添加 -fopenmp。对于 llama-cpp-python 来说,通常 CMake 会自动检测,如果未能正确链接,可以尝试在环境变量中设置相应的 CMake 参数,例如:

    bash 复制代码
    export CMAKE_ARGS="-DCMAKE_CXX_FLAGS=-fopenmp"
    pip install --no-cache-dir llama-cpp-python

(最终解决)在 Conda 环境中安装 libgomp

  1. 确认 libgomp 安装成功

    在当前 Conda 环境中执行:

    bash 复制代码
    conda list libgomp

    确认输出中包含 libgomp。确保库文件(如 libgomp.so.1)位于 $CONDA_PREFIX/lib 目录下。

  2. 设置环境变量

    为确保编译时可以正确找到 OpenMP 库,可以将 Conda 库路径添加到 LD_LIBRARY_PATH 中(如果尚未设置):

    bash 复制代码
    export LD_LIBRARY_PATH=$CONDA_PREFIX/lib:$LD_LIBRARY_PATH

    建议将此命令添加到 Conda 环境的激活脚本中,以便每次激活环境时自动生效。

  3. 重新编译安装 llama-cpp-python

    在确保 libgomp 可用后,重新尝试安装 llama-cpp-python:

    bash 复制代码
    pip install --no-cache-dir llama-cpp-python

    如果你需要启用 OpenMP 支持且遇到链接问题,可以尝试添加编译标志:

    bash 复制代码
    export CMAKE_ARGS="-DCMAKE_CXX_FLAGS=-fopenmp"
    pip install --no-cache-dir llama-cpp-python
  4. 检查编译日志

    观察编译输出,确认 libgomp 相关的错误不再出现。如果仍有问题,建议使用详细日志:

    bash 复制代码
    pip install --no-cache-dir llama-cpp-python -v

    分析日志中的错误信息,以便进一步调整环境或 CMake 参数。

相关推荐
钡铼技术物联网关14 分钟前
支持Linux、鸿蒙的工业AIOT智能终端在钢铁厂的应用
linux·arm开发·边缘计算
爱学习的小王!34 分钟前
有关Java中的注解和反射
java·开发语言·笔记·python
不被定义的~wolf35 分钟前
【Linux系统编程】管道
linux·服务器
bksheng1 小时前
【Pytorch】torch.logical_or 和 or 的区别
人工智能·pytorch·python
mosquito_lover11 小时前
基于Python的物联网智慧农业数据采集与管理系统设计方案
人工智能·python·物联网
fantasy_41 小时前
LeetCode455☞分发饼干
python·算法·leetcode·贪心算法
終不似少年遊*1 小时前
vscode编译器的一些使用问题
ide·vscode·python·编辑器·使用技巧
Bruce_Liuxiaowei1 小时前
基于Python的PDF转PNG可视化工具开发
开发语言·python·pdf
西北大程序猿1 小时前
文件系统 linux ─── 第19课
linux·运维·服务器
爱的叹息2 小时前
Java 集合遍历过程中修改数据触发 Fail-Fast 机制 ,导致报ConcurrentModificationException异常
java·windows·python