训练模型时报下面错误:
could not load library libcudnn_cnn_train.so.8
出现错误的可能原因:
PyTorch 有自己的 CUDA 依赖项(包括 cuDNN),所以需要从库路径中移除本地安装的 cuDNN,让 PyTorch 加载它自己的库。
如果想使用本地安装的 CUDA 工具包,可以从源代码构建 PyTorch。
解决方法之一:
python
cd /usr/local/cuda-12.1/lib64
sudo rm -f libcudnn*
cd /usr/local/cuda-12.1/include
sudo rm -f cudnn*
参考文档: