Ubuntu 18.04 离线安装 CUDA 11.2 + cuDNN 8.2 (修复 Paddle 缺少 .so 报错)

适用场景: Ubuntu 18.04, ROS Melodic, PaddlePaddle, 只有本地安装包,网络不佳或为了避免依赖冲突。

1. 安装 CUDA 11.2 (只装核心组件)

为了避免安装整个 CUDA 包时触发 Java 依赖(Nsight工具)导致安装失败或系统冲突,我们只安装编译器和数学库

在包含 .deb 文件的目录下执行:

bash 复制代码
# 1. 安装本地仓库包
sudo dpkg -i cuda-repo-ubuntu1804-11-2-local_11.2.2-461.38-1_amd64.deb

# 2. 添加密钥 (根据终端提示执行,通常是下面这句)
sudo apt-key add /var/cuda-repo-ubuntu1804-11-2-local/7fa2af80.pub

# 3. 更新源
sudo apt-get update

# 4. 【关键】只安装编译器、数学库和命令行工具 (避开图形界面和Java)
sudo apt-get install cuda-compiler-11-2 cuda-libraries-dev-11-2 cuda-command-line-tools-11-2

2. 安装 cuDNN 8.2.1

在包含 .tgz 文件的目录下执行:

bash 复制代码
# 1. 解压
tar -xzvf cudnn-11.3-linux-x64-v8.2.1.32.tgz

# 2. 拷贝头文件到 CUDA 目录
sudo cp cuda/include/cudnn*.h /usr/local/cuda-11.2/include

# 3. 拷贝库文件到 CUDA 目录 (注意 -P 保留软链)
sudo cp -P cuda/lib64/libcudnn* /usr/local/cuda-11.2/lib64

# 4. 赋予读取权限
sudo chmod a+r /usr/local/cuda-11.2/include/cudnn*.h /usr/local/cuda-11.2/lib64/libcudnn*

3. 【重点】修复 Paddle/ROS 报错 (libcublas.so / libcusolver.so not found)

问题原因: CUDA 安装后生成的库名带有版本号(如 libcusolver.so.11),但 Paddle 推理库死板地寻找不带版本号的文件名(libcusolver.so)。

解决方法: 创建软链接骗过程序。一次性执行下面所有命令,预防未来报错:

bash 复制代码
cd /usr/local/cuda-11.2/lib64

# 修复 libcublas 报错
sudo ln -sf libcublas.so.11 libcublas.so

# 修复 libcusolver 报错
sudo ln -sf libcusolver.so.11 libcusolver.so

# 预防性修复其他常见数学库 (cufft, curand 等)
sudo ln -sf libcufft.so.10 libcufft.so
sudo ln -sf libcurand.so.10 libcurand.so
sudo ln -sf libcusparse.so.11 libcusparse.so
sudo ln -sf libnppc.so.11 libnppc.so

4. 配置环境变量

确保 ~/.bashrc 中有以下内容:

bash 复制代码
export CUDA_HOME=/usr/local/cuda-11.2
export PATH=$CUDA_HOME/bin:$PATH
export LD_LIBRARY_PATH=$CUDA_HOME/lib64:$LD_LIBRARY_PATH

生效并验证:

bash 复制代码
source ~/.bashrc
nvcc -V
# 输出 release 11.2 即为成功

补充:关于 TensorRT 警告

如果运行日志出现黄色警告:TensorRT dynamic library is not found。

  • 如果你的算法必须用 TensorRT 加速,则需要去 NVIDIA 官网下载对应 CUDA 11.2 的 TensorRT 8.x 包并解压配置。

  • 如果不需要,可在 ROS launch 文件中将 use_tensorrt 设为 false 忽略警告。

相关推荐
扛枪的书生30 分钟前
Linux 网络管理器用法速查
linux
顺风尿一寸3 小时前
Java Socket 内核之旅:从 SocketChannel.read() 到 tcp_recvmsg 与 epoll 的完整调用链路
linux
XIAOHEZIcode10 小时前
Ubuntu 终端美化全栈指南:Bash 到 Kitty 踩坑实录
linux·ubuntu·命令行
唐青枫12 小时前
别再只会用 cron:Linux systemd Timer 定时任务实战详解
linux
AlfredZhao2 天前
生产环境里,为什么不建议把普通端口直接暴露到公网?
linux·https·443·80
戴为沐3 天前
Linux内存扩容指南
linux
zylyehuo4 天前
Linux 彻底且安全地删除文件
linux
用户805533698034 天前
主线 U-Boot 上 RK3506:和闭源 rkbin 拔河的三个隐性契约
linux·嵌入式
用户034095297914 天前
linux fcitx 5 雾凇拼音 设置在中文输入法下仍然输入英文标点
linux
Web3探索者6 天前
可视化服务器管理和传统命令行区别是什么?新手教程:Linux 运维到底该用图形界面还是 SSH 命令行?
linux·ssh