1.安装NVIDIA Driver
1.1 下载NVIDIA Driver文件
PS:本文以run文件为安装步骤设置
按照截图步骤下载以下的驱动
打开网址:
nvidia官网驱动下载地址
找到这个驱动页面

下载最新的驱动

放到服务器中
如果没有执行权限可以添加以下执行权限命令为:
bash
chmod a+x NVIDIA-Linux-x86_64-580.95.05.run
直接执行
bash
./NVIDIA-Linux-x86_64-580.95.05.run
点击nvidia proprietary

安装完成后即可执行命令
bash
nvidia-smi

驱动安装完毕
2.安装NVSwitch
2.1它是什么?
NVSwitch 是连接多 GPU 的交换机硬件,工作在 NVLink 协议层之上,用来实现高性能、低延迟、全互联的 GPU 通信。让 GPU 之间可以非常高效地通信(不仅限于几个 GPU,而是大规模 GPU 系统),并且支持集体通信优化(SHARP)。
2.2下载nvidia-fabricmanager
继续打开上面的nvidia官网驱动页面
nvidia官网驱动下载地址
按照你的卡型号下载rpm离线驱动



2.3安装nvidia-fabricmanager
下载完成后放到服务器上后执行命令:
bash
rpm -i nvidia-driver-local-repo-rhel8-580.105.08-1.0-1.x86_64.rpm
dnf clean all
dnf -y module install nvidia-driver:latest-dkms
一般情况下会在"/var"目录下有一个"/var/nvidia-driver-local-repo-rhel8-580.105.08"目录
在这个目录下找到nvidia-fabricmanager开头的rpm文件
我的这个版本名字叫"nvidia-fabricmanager-580.105.08-1.x86_64.rpm"
执行
bash
rpm -ivh nvidia-fabricmanager-580.105.08-1.x86_64.rpm
安装完成后即可
IB网络驱动
2.安装NVSwitch
还是登陆nvidia官网下载驱动
解压后直接执行install即可
