适用场景: Ubuntu 18.04, ROS Melodic, PaddlePaddle, 只有本地安装包,网络不佳或为了避免依赖冲突。
1. 安装 CUDA 11.2 (只装核心组件)
为了避免安装整个 CUDA 包时触发 Java 依赖(Nsight工具)导致安装失败或系统冲突,我们只安装编译器和数学库。
在包含 .deb 文件的目录下执行:
bash
# 1. 安装本地仓库包
sudo dpkg -i cuda-repo-ubuntu1804-11-2-local_11.2.2-461.38-1_amd64.deb
# 2. 添加密钥 (根据终端提示执行,通常是下面这句)
sudo apt-key add /var/cuda-repo-ubuntu1804-11-2-local/7fa2af80.pub
# 3. 更新源
sudo apt-get update
# 4. 【关键】只安装编译器、数学库和命令行工具 (避开图形界面和Java)
sudo apt-get install cuda-compiler-11-2 cuda-libraries-dev-11-2 cuda-command-line-tools-11-2
2. 安装 cuDNN 8.2.1
在包含 .tgz 文件的目录下执行:
bash
# 1. 解压
tar -xzvf cudnn-11.3-linux-x64-v8.2.1.32.tgz
# 2. 拷贝头文件到 CUDA 目录
sudo cp cuda/include/cudnn*.h /usr/local/cuda-11.2/include
# 3. 拷贝库文件到 CUDA 目录 (注意 -P 保留软链)
sudo cp -P cuda/lib64/libcudnn* /usr/local/cuda-11.2/lib64
# 4. 赋予读取权限
sudo chmod a+r /usr/local/cuda-11.2/include/cudnn*.h /usr/local/cuda-11.2/lib64/libcudnn*
3. 【重点】修复 Paddle/ROS 报错 (libcublas.so / libcusolver.so not found)
问题原因: CUDA 安装后生成的库名带有版本号(如 libcusolver.so.11),但 Paddle 推理库死板地寻找不带版本号的文件名(libcusolver.so)。
解决方法: 创建软链接骗过程序。一次性执行下面所有命令,预防未来报错:
bash
cd /usr/local/cuda-11.2/lib64
# 修复 libcublas 报错
sudo ln -sf libcublas.so.11 libcublas.so
# 修复 libcusolver 报错
sudo ln -sf libcusolver.so.11 libcusolver.so
# 预防性修复其他常见数学库 (cufft, curand 等)
sudo ln -sf libcufft.so.10 libcufft.so
sudo ln -sf libcurand.so.10 libcurand.so
sudo ln -sf libcusparse.so.11 libcusparse.so
sudo ln -sf libnppc.so.11 libnppc.so
4. 配置环境变量
确保 ~/.bashrc 中有以下内容:
bash
export CUDA_HOME=/usr/local/cuda-11.2
export PATH=$CUDA_HOME/bin:$PATH
export LD_LIBRARY_PATH=$CUDA_HOME/lib64:$LD_LIBRARY_PATH
生效并验证:
bash
source ~/.bashrc
nvcc -V
# 输出 release 11.2 即为成功
补充:关于 TensorRT 警告
如果运行日志出现黄色警告:TensorRT dynamic library is not found。
-
如果你的算法必须用 TensorRT 加速,则需要去 NVIDIA 官网下载对应 CUDA 11.2 的 TensorRT 8.x 包并解压配置。
-
如果不需要,可在 ROS launch 文件中将 use_tensorrt 设为 false 忽略警告。