在ubuntu服务器下安装cuda和cudnn(笔记)

目录

[0 引言](#0 引言)

[1 相关环境查询](#1 相关环境查询)

[2 安装cuda](#2 安装cuda)

[2.1 下载并安装](#2.1 下载并安装)

[2.2 安装选项配置](#2.2 安装选项配置)

[2.3 验证安装](#2.3 验证安装)

[3 安装cudnn](#3 安装cudnn)

[3.1 下载](#3.1 下载)

[3.2 解压](#3.2 解压)

[3.3 删除旧版本 cuDNN](#3.3 删除旧版本 cuDNN)

[3.4 复制新文件到 CUDA 目录](#3.4 复制新文件到 CUDA 目录)

[3.5 设置文件权限](#3.5 设置文件权限)

[3.6 创建软链接](#3.6 创建软链接)

[3.7 验证安装](#3.7 验证安装)


0 引言

我在使用服务器的cuda11.8的时候发现cuda不全,但是又没权限去直接修改cuda11.8文件夹,所以在安装完到cuda11.8_full文件夹后,再移植到服务器管理员文件夹下,通过映射修改cuda11.8。

1 相关环境查询

复制代码
(base) ubuntu@xuwei-24506:~/workdir/qita/OSTeC2$ uname -m
x86_64
(base) ubuntu@xuwei-24506:~/workdir/qita/OSTeC2$ lsb_release -a
No LSB modules are available.
Distributor ID: Ubuntu
Description:    Ubuntu 22.04.3 LTS
Release:        22.04
Codename:       jammy

2 安装cuda

cuda网址:CUDA Toolkit Archive | NVIDIA Developer

2.1 下载并安装

根据自己的需求选择安装的cuda版本

以下是我选的cuda11.8版本,直接服务器终端运行下载并运行安装

复制代码
wget https://developer.download.nvidia.com/compute/cuda/11.8.0/local_installers/cuda_11.8.0_520.61.05_linux.run
sudo bash cuda_11.8.0_520.61.05_linux.run

输入accept

2.2 安装选项配置

除工具包外其他的都不要,再选择Options(选项)

选择Toolkit Options(工具包选项)

因为/usr/local/cuda-11.8/里本来就是有的,所以新建的cuda11.8要换个新的文件夹,这里我建了个/usr/local/cuda-11.8_full/

注意:安装前确认你要安装的文件夹是不存在的,可以用ls /usr/local/去确认

后面选择done回去,再install安装

2.3 验证安装

运行代码:

复制代码
/usr/local/cuda-11.8_full/bin/nvcc --version

结果类似于:

复制代码
nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2022 NVIDIA Corporation
Built on Wed_Sep_21_10:33:58_PDT_2022
Cuda compilation tools, release 11.8, V11.8.89
Build cuda_11.8.r11.8/compiler.31833905_0

3 安装cudnn

网址:cuDNN Archive | NVIDIA Developer

3.1 下载

我选的是Linux x86_64 (Tar)手动安装。而Deb的是自动安装,因为不太熟悉,所以没用Deb的。

3.2 解压

下载完后,传到服务器当前文件下,在终端中使用 tar 命令解压 tar.xz 文件:

复制代码
tar -xvf cudnn-linux-x86_64-8.9.7.29_cuda11-archive.tar.xz
cd cudnn-linux-x86_64-8.9.7.29_cuda11-archive

3.3 删除旧版本 cuDNN

如果你系统中已经安装了旧版本的 cuDNN,建议删除旧版本文件,避免版本冲突:

复制代码
sudo rm -f /usr/local/cuda-11.8_full/include/cudnn*.h 
sudo rm -f /usr/local/cuda-11.8_full/lib64/libcudnn*

3.4 复制新文件到 CUDA 目录

将新解压的 cuDNN 文件复制到指定的 /usr/local/cuda-11.8_full 目录下:

复制代码
sudo cp include/cudnn*.h /usr/local/cuda-11.8_full/include/ 
sudo cp lib/libcudnn* /usr/local/cuda-11.8_full/lib64/

3.5 设置文件权限

确保正确的权限,确保所有用户可以读取 cuDNN 的头文件和库文件:

复制代码
sudo chmod a+r /usr/local/cuda-11.8_full/include/cudnn*.h /usr/local/cuda-11.8_full/lib64/libcudnn*

3.6 创建软链接

有时你可能需要手动创建符号链接,以确保库版本的一致性。进入 /usr/local/cuda-11.8_full/lib64 目录并创建软链接:

复制代码
cd /usr/local/cuda-11.8_full/lib64 
sudo ln -sf libcudnn.so.8.9.7 libcudnn.so.8 
sudo ln -sf libcudnn.so.8 libcudnn.so

3.7 验证安装

你可以通过查看 cudnn_version.h 文件来验证安装的版本:

复制代码
cat /usr/local/cuda-11.8_full/include/cudnn_version.h | grep CUDNN_MAJOR -A 2

结果类似于:

复制代码
#define CUDNN_MAJOR 8
#define CUDNN_MINOR 9
#define CUDNN_PATCHLEVEL 7
--
#define CUDNN_VERSION (CUDNN_MAJOR * 1000 + CUDNN_MINOR * 100 + CUDNN_PATCHLEVEL)

/* cannot use constexpr here since this is a C-only file */
相关推荐
A小辣椒10 小时前
TShark:Wireshark CLI 功能
linux
A小辣椒14 小时前
TShark:基础知识
linux
AlfredZhao16 小时前
OCI 明明分配了 200G 系统盘,为什么 df 只看到 30G?
linux·oci
AlfredZhao1 天前
vi 删除指定范围的行,不用再反复按 dd
linux·vi
用户9718356334662 天前
银河麒麟 KY10 申威(SW64) 安装 nginx-1.16.1-2.p01.ky10.sw_64.rpm 详细步骤
linux
猪脚踏浪2 天前
linux 拷贝文件或目录到指定的位置
linux
摇滚侠2 天前
Linux CentOS7 rpm 安装 MySQL 5.7
linux·运维·mysql
bush42 天前
嵌入式linux学习记录十四、术语
linux·嵌入式
载数而行5202 天前
Linux 11 动态监控指令top
linux
不会C语言的男孩2 天前
Linux 系统编程 · 第 8 章:进程基础
linux·c语言