linux（ubuntu）中Conda、CUDA安装Xinference报错ERROR: Failed to build (llama-cpp-python)

文章目录

一、常规办法
二、继续
三、继续
[四、缺少 libgomp库](#四、缺少 libgomp库)
[（最终解决）在 Conda 环境中安装 libgomp](#（最终解决）在 Conda 环境中安装 libgomp)

如果符合标题情况

执行的：

bash 复制代码

pip install "xinference[all]"

大概率是最终解决的情况。

一、常规办法

llama-cpp-python 依赖 CMake、Make 和 g++ 来编译，所以可能是 缺少依赖 或者 环境配置不对。按照以下步骤排查问题并解决：

1. 确保 Python 版本符合要求
llama-cpp-python 需要 Python >=3.8 ，推荐 Python 3.10 或更高：

sh 复制代码

python --version

如果 Python 版本低于 3.8，建议升级。

如果使用 conda：

sh 复制代码

conda create -n xinference_env python=3.10
conda activate xinference_env

2. 安装必要的依赖

如果你在 Ubuntu / Debian：

sh 复制代码

sudo apt update
sudo apt install -y cmake make g++ python3-dev

如果你在 CentOS / RHEL：

sh 复制代码

sudo yum install -y cmake make gcc-c++ python3-devel

如果你在 macOS：

sh 复制代码

brew install cmake

3. 重新尝试安装

使用 pip 重新安装：

sh 复制代码

pip install --no-cache-dir llama-cpp-python

或者 强制重新编译：

sh 复制代码

CMAKE_ARGS="-DLLAMA_CUBLAS=on" pip install --force-reinstall --no-cache-dir llama-cpp-python

如果你有 NVIDIA GPU 并希望使用 CUDA 加速：

sh 复制代码

CMAKE_ARGS="-DLLAMA_CUBLAS=on" pip install llama-cpp-python --no-cache-dir

4. 检查 pip 是否最新

有时 pip 版本太旧会导致安装失败：

sh 复制代码

pip install --upgrade pip setuptools wheel

5. 使用 Prebuilt 版本（跳过编译）

如果仍然失败，可以安装 预编译版本：

sh 复制代码

pip install llama-cpp-python --prefer-binary

总结

✅ 检查 Python 版本 (python --version)

✅ 安装依赖 (sudo apt install cmake make g++ python3-dev)

✅ 清除缓存并强制重新安装 (pip install --no-cache-dir llama-cpp-python)

✅ 尝试 CUDA 版本 （如果有 GPU）

✅ 使用预编译版本 (pip install llama-cpp-python --prefer-binary)

二、继续

在这种情况下，通常是因为构建环境的某些依赖或版本不满足要求。请按照以下步骤逐项排查和解决问题：

1. 升级构建工具和 Python 打包工具

确保你的 pip、setuptools 和 wheel 均为最新版本：

sh 复制代码

pip install --upgrade pip setuptools wheel

2. 检查 CMake 版本

低版本的 CMake 可能导致编译失败。请确认你的 CMake 至少在 3.18 以上：

sh 复制代码

cmake --version

如果版本较低，建议更新 CMake：

使用 Snap 安装最新版本：
sh 复制代码
```
sudo snap install cmake --classic
```
或者从 CMake 官网下载最新二进制包并安装。

3. 检查 g++ 编译器版本

llama-cpp-python 需要支持 C++17。请确保 g++ 版本足够新（推荐 g++ 9 或更高）：

sh 复制代码

g++ --version

如果版本过低，安装 g+±9（或更高版本）：

sh 复制代码

sudo apt install g++-9

并通过 update-alternatives 设置默认 g++：

sh 复制代码

sudo update-alternatives --install /usr/bin/g++ g++ /usr/bin/g++-9 90

4. 配置 CUDA 环境变量

既然你已经安装了 CUDA，请确保环境变量正确设置，特别是 CUDA_HOME（这有助于 CMake 定位 CUDA 库）：

sh 复制代码

export CUDA_HOME=/usr/local/cuda
export PATH=$CUDA_HOME/bin:$PATH
export LD_LIBRARY_PATH=$CUDA_HOME/lib64:$LD_LIBRARY_PATH

你可以将这些配置添加到 ~/.bashrc 或 ~/.profile 中以便永久生效。

5. 尝试详细日志安装

使用更详细的日志输出安装，以便获取具体错误信息：

sh 复制代码

pip install --no-cache-dir llama-cpp-python -v

观察输出日志，确认是否有其他缺失的依赖或编译错误提示。

6. 从源码安装

如果通过 pip 直接安装仍然失败，尝试从源码克隆并安装：

sh 复制代码

git clone https://github.com/abetlen/llama-cpp-python.git
cd llama-cpp-python
pip install .

这样可以获得更多编译过程中的详细信息，有助于定位问题。

三、继续

错误日志可能问题出在 CMake 无法找到 vendor/llama.cpp 目录下应有的 CMake 配置文件，以及 llava 相关子目录缺失。这通常有两种原因：

源码包缺失子模块内容

如果你直接通过 pip 安装，而源码包中未包含子模块（即 vendor/llama.cpp 及其子目录），就会导致构建失败。解决方案是从 GitHub 克隆仓库时使用 --recursive 选项，确保拉取所有子模块内容，然后再安装。例如：
bash 复制代码
```
git clone --recursive https://github.com/abetlen/llama-cpp-python.git
cd llama-cpp-python
pip install .
```
不需要构建 llava 支持

错误日志显示构建过程中试图添加 llava 相关目标，但对应目录缺失。如果你不需要 llava（通常用于特定扩展功能），可以在编译时禁用它。尝试在安装时传递 CMake 参数关闭 llava 模块：
bash 复制代码
```
CMAKE_ARGS="-DLLAMA_CPP_BUILD_LLAVA=OFF" pip install --no-cache-dir llama-cpp-python
```
这样可以跳过对不存在目录的引用。

综合建议

方案一：从源码克隆并安装（推荐用于 CUDA 支持）

通过 Git 克隆完整仓库（包含子模块）再安装：
bash 复制代码
```
git clone --recursive https://github.com/abetlen/llama-cpp-python.git
cd llama-cpp-python
pip install .
```
方案二：禁用 llava 模块重新编译

如果你确定不需要 llava 支持，可以禁用它：
bash 复制代码
```
CMAKE_ARGS="-DLLAMA_CPP_BUILD_LLAVA=OFF" pip install --no-cache-dir llama-cpp-python
```

四、缺少 libgomp库

从错误日志来看，构建过程中链接 libggml-cpu.so 时缺失 OpenMP 运行时库（libgomp.so.1），导致一系列 GOMP_* 符号无法解析。这通常表明当前系统中缺少 GNU OpenMP 库。

为解决此问题，请依次执行以下步骤：

安装 libgomp 库

在 Ubuntu 系统中，通常可以通过以下命令安装 libgomp：
bash 复制代码
```
sudo apt-get update
sudo apt-get install libgomp1
```
如果需要开发头文件，也可以安装：
bash 复制代码
```
sudo apt-get install libgomp-dev
```
验证库路径

安装后，确认 libgomp.so.1 存在于系统库目录（如 /usr/lib/x86_64-linux-gnu/）：
bash 复制代码
```
locate libgomp.so.1
```
或者：
bash 复制代码
```
find /usr -name "libgomp.so.1"
```
确保编译器调用正确的 OpenMP 链接标志

如果依然报错，请检查是否需要在编译参数中添加 -fopenmp。对于 llama-cpp-python 来说，通常 CMake 会自动检测，如果未能正确链接，可以尝试在环境变量中设置相应的 CMake 参数，例如：
bash 复制代码
```
export CMAKE_ARGS="-DCMAKE_CXX_FLAGS=-fopenmp"
pip install --no-cache-dir llama-cpp-python
```

（最终解决）在 Conda 环境中安装 libgomp

确认 libgomp 安装成功

在当前 Conda 环境中执行：
bash 复制代码
```
conda list libgomp
```
确认输出中包含 libgomp。确保库文件（如 libgomp.so.1）位于 $CONDA_PREFIX/lib 目录下。
设置环境变量

为确保编译时可以正确找到 OpenMP 库，可以将 Conda 库路径添加到 LD_LIBRARY_PATH 中（如果尚未设置）：
bash 复制代码
```
export LD_LIBRARY_PATH=$CONDA_PREFIX/lib:$LD_LIBRARY_PATH
```
建议将此命令添加到 Conda 环境的激活脚本中，以便每次激活环境时自动生效。
重新编译安装 llama-cpp-python

在确保 libgomp 可用后，重新尝试安装 llama-cpp-python：
bash 复制代码
```
pip install --no-cache-dir llama-cpp-python
```
如果你需要启用 OpenMP 支持且遇到链接问题，可以尝试添加编译标志：
bash 复制代码
```
export CMAKE_ARGS="-DCMAKE_CXX_FLAGS=-fopenmp"
pip install --no-cache-dir llama-cpp-python
```
检查编译日志

观察编译输出，确认 libgomp 相关的错误不再出现。如果仍有问题，建议使用详细日志：
bash 复制代码
```
pip install --no-cache-dir llama-cpp-python -v
```
分析日志中的错误信息，以便进一步调整环境或 CMake 参数。