pytorch+cuda+cudnn的版本问题相对于GraspNet来说 至关重要!!!至关重要!!!至关重要!!!(重要的事情说三边)
我的显卡是3070
那么首先说结论
使用30系显卡,低于11.1版本的cuda编译时会出错
nvcc fatal : Unsupported gpu architecture 'compute_86'
之前安装的是 CUDA 11.0,而 compute_86(也就是 RTX 30 系列支持)从 CUDA 11.1 才开始支持,这正是我开始编译失败的原因。
而与之对应的GraspNet官方推荐的pytorch1.6.0,已经在新版本中使用安装命令都会有问题了,下载不下来。
那么现在知道pytorch+cuda+cudnn的版本太低不行,版本高呢?
pytorch版本高于1.9之后编译knn会报错
fatal error: THC/THC.h: 没有那个文件或目录
此时我的版本为:
bash
>>> import torch
>>> print(torch.__version__)
2.0.0+cu117
>>> print(torch.cuda.is_available())
True
>>> print(torch.version.cuda)
11.7
THC/THC.h
头文件基本已完全移除,任何试图包含 THC/THC.h
的项目都会编译失败。
甚至于从1.8 之后开始,THC
就已经开始被逐步剥离和隐藏。
这个THC/THC.h
是属于 PyTorch 的 旧版 C/C++ 扩展接口(legacy ATen/TH/THC)。
经过一整天对pytorch及cuda/cudnn当前各个版本的尝试之后发现:
安装版本如下可以完美避开版本老旧以及版本过新所造成的各种问题
如nvcc fatal: Unknown option '-generate-dependencies-with-compile'问题
point编译和knn编译时出现nvcc fatal : Unsupported gpu architecture 'compute_86' 问题
THC/THC.h
头文件问题等。
bash
>>> import torch
>>> print(torch.__version__)
1.8.0+cu111
>>> print(torch.cuda.is_available())
True
>>> torch.backends.cudnn.version()
8005
>>> print(torch.version.cuda)
11.1
>>>
实际上对于上述每个问题的解决是有具体办法的,但是有的问题解决起来简单有的却不一定简单,如果可以保留源代码不作修改就能直接使用不失为一种更快捷的办法。
那么下面是安装每个版本的方法:
首先安装cuda和cudnn
cuda版本跟着驱动来我的驱动版本是535
即:
因为是安装特定版本的pytorch、cuda和cudnn我就不说按照官网给的版本匹配来选择了直接就是特定版本的cuda安装
cuda的版本为11.1
在https://developer.nvidia.com/cuda-toolkit-archive
中找到
按照如下步骤选择安装,找到安装命令

具体安装命令如下:
bash
wget https://developer.download.nvidia.com/compute/cuda/11.1.1/local_installers/cuda_11.1.1_455.32.00_linux.runsudo
sh cuda_11.1.1_455.32.00_linux.run
在安装过程中需要取消驱动的安装,这里我安装过了所以用的是别人的图,所以版本可能对不上。到下面的界面后在第一个出按enter取消勾选安装驱动,然后install回车即可开始安装。

随后配置bashrc
在最后面添加
bash
export PATH=$PATH:/usr/local/cuda/bin
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda/lib64
export LIBRARY_PATH=$LIBRARY_PATH:/usr/local/cuda/lib64
之后测试安装是否成功
bash
source ~/.bashrc
nvcc -V
结果如下

安装cudnn
cuDNN Archive | NVIDIA Developer

下载后解压
bash
tar -vxf ./cudnn-linux-x86_64-8.9.7.29_cuda11-archive.tar.xz
复制文件
bash
sudo cp cudnn-linux-x86_64-8.9.7.29_cuda11-archive/include/* /usr/local/cuda-11.1/include
sudo cp cudnn-linux-x86_64-8.9.7.29_cuda11-archive/lib/libcudnn* /usr/local/cuda-11.1/lib64
添加权限
bash
sudo chmod a+r /usr/local/cuda-11.1/include/cudnn.h
sudo chmod a+r /usr/local/cuda-11.1/lib64/libcudnn*
测试安装
bash
cat /usr/local/cuda-11.1/include/cudnn_version.h | grep CUDNN_MAJOR -A 2
结果应该如下

安装pytorch
先安装anaconda,在
下载之后
bash
bash Anaconda3-2023.07-2-Linux-x86_64.sh
根据操作提示一直回车到yes即可
安装完成后激活一个conda环境,我这里给环境名字起得是torch,可以换成其他名字。
bash
conda create -n torch python=3.8
激活对应环境
bash
conda activate torch
退出conda环境
bash
conda deactivate
移除conda环境
bash
conda env remove -n torch
取消默认激活conda环境
bash
conda config --set auto_activate_base false
安装pytorch 1.8.0(虽然是在conda环境中使用的安装命令,但是并不是安装到的conda环境中)
Previous PyTorch Versions | PyTorch
bash
pip install torch==1.8.0+cu111 torchvision==0.9.0+cu111 torchaudio==0.8.0 -f https://download.pytorch.org/whl/torch_stable.html
安装完成后使用命令查看是否安装成功

bash
python
import torch
print(torch.__version__)
print(torch.cuda.is_available())
torch.version.cuda
之后在根据GraspNet官网的步骤一直走下来就可以
最后运行sh command_demo.sh即可查看