libonnxruntime_providers_cuda.so with error: libcudnn_adv.so.9

在安装了 onnxruntime-gpu 后,使用 CUDA 时报错:

shell 复制代码
2025-01-02 11:40:03.935340441 [E:onnxruntime:Default, provider_bridge_ort.cc:1862 TryGetProviderInfo_CUDA] /onnxruntime_src/onnxruntime/core/session/provider_bridge_ort.cc:1539 onnxruntime::Provider& onnxruntime::ProviderLibrary::Get() [ONNXRuntimeError] : 1 : FAIL : Failed to load library libonnxruntime_providers_cuda.so with error: libcudnn_adv.so.9: cannot open shared object file: No such file or directory

2025-01-02 11:40:03.935371734 [W:onnxruntime:Default, onnxruntime_pybind_state.cc:993 CreateExecutionProviderInstance] Failed to create CUDAExecutionProvider. Require cuDNN 9.* and CUDA 12.*. Please install all dependencies as mentioned in the GPU requirements page (https://onnxruntime.ai/docs/execution-providers/CUDA-ExecutionProvider.html#requirements), make sure they're in the PATH, and that your GPU is supported.

很明显,cudnn 并为正确配置。

首先需要说明:

PyTorch 的许多预编译版本(如通过 pip 或 conda 安装)会自带 CUDA 和 cuDNN。它会直接使用打包的版本,而不是依赖系统中全局安装的库。
ONNX Runtime 需要系统中明确安装且可用的 cuDNN 动态库

安装 cudnn,注意版本对应:

https://developer.nvidia.com/cudnn-downloads

shell 复制代码
proxychains4 wget https://developer.download.nvidia.com/compute/cudnn/redist/cudnn/linux-x86_64/cudnn-linux-x86_64-9.1.0.70_cuda12-arch
ive.tar.xz

解压下载的文件:

shell 复制代码
tar -xvf cudnn-linux-x86_64-9.1.0.70_cuda12-archive.tar.xz

解压后,会看到一个名为 cuda 的目录,包含以下子目录:

  • include/: 包含头文件,如 cudnn.h
  • lib/: 包含动态库,如 libcudnn.so

将解压出来的文件复制到系统的 CUDA 安装路径(默认路径是 /usr/local/cuda/):

shell 复制代码
sudo cp ./cudnn-linux-x86_64-9.1.0.70_cuda12-archive/include/* /usr/local/cuda-12.4/include/

sudo cp ./cudnn-linux-x86_64-9.1.0.70_cuda12-archive/lib/* /usr/local/cuda-12.4/lib64/

更新动态链接库缓存,以确保系统可以正确找到 cuDNN 的动态库文件:

检查 LD_LIBRARY_PATH 是否包含 /usr/local/cuda/lib64:

shell 复制代码
echo $LD_LIBRARY_PATH

如果没有包含,编辑 ~/.bashrc 文件,添加以下内容:

shell 复制代码
export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH
shell 复制代码
source ~/.bashrc

更新动态库缓存:

shell 复制代码
sudo ldconfig

验证 cuDNN 是否正确安装:

shell 复制代码
ls /usr/local/cuda/lib64 | grep libcudnn

输出:

shell 复制代码
libcudnn_adv.so
libcudnn_adv.so.9
libcudnn_adv.so.9.1.0
libcudnn_adv_static.a
libcudnn_adv_static_v9.a
libcudnn_cnn.so
...

检查 cuDNN 版本:

shell 复制代码
cat /usr/local/cuda/include/cudnn_version.h | grep CUDNN_MAJOR -A 2

输出:

shell 复制代码
#define CUDNN_MAJOR 9
#define CUDNN_MINOR 1
#define CUDNN_PATCHLEVEL 0
相关推荐
风虎云龙科研服务器3 小时前
深度学习GPU服务器推荐:打造高效运算平台
服务器·人工智能·深度学习
好评笔记8 小时前
多模态论文笔记——U-ViT(国内版DiT)
论文阅读·人工智能·深度学习·计算机视觉·aigc·transformer·u-vit
知来者逆8 小时前
安卓NDK视觉开发——手机拍照文档边缘检测实现方法与库封装
深度学习·计算机视觉·智能手机·扫描全能王·边缘检测
盼小辉丶9 小时前
TensorFlow深度学习实战(4)——正则化技术详解
人工智能·深度学习·tensorflow
梦雨羊9 小时前
【持续更新中】transformer详解和embedding大模型
深度学习·transformer·embedding
鸟哥大大10 小时前
Seed-TTS: A Family of High-Quality Versatile Speech Generation Models
人工智能·深度学习·机器学习·aigc·语音识别
Fuliy9611 小时前
NO.1 《机器学习期末复习篇》以题(问答题)促习(人学习),满满干huo,大胆学大胆补!
人工智能·深度学习·机器学习
CSJK-13 小时前
模式识别与机器学习 | 十一章 概率图模型基础
人工智能·深度学习·机器学习
余胜辉14 小时前
随机梯度下降(SGD)算法的深度剖析与应用探索
深度学习·机器学习·优化算法·sgd·随机梯度下降
Power202466615 小时前
NLP论文速读|基于主动检索的渐进多模态推理
人工智能·深度学习·机器学习·自然语言处理·nlp