从0到1安装NVIDIA驱动(NVSwitch+Driver+IB网络驱动)

1.安装NVIDIA Driver

1.1 下载NVIDIA Driver文件


PS:本文以run文件为安装步骤设置

按照截图步骤下载以下的驱动

打开网址:
nvidia官网驱动下载地址

找到这个驱动页面

下载最新的驱动

放到服务器中

如果没有执行权限可以添加以下执行权限命令为:

bash 复制代码
chmod a+x NVIDIA-Linux-x86_64-580.95.05.run

直接执行

bash 复制代码
./NVIDIA-Linux-x86_64-580.95.05.run

点击nvidia proprietary

安装完成后即可执行命令

bash 复制代码
nvidia-smi

驱动安装完毕

2.安装NVSwitch

2.1它是什么?

NVSwitch 是连接多 GPU 的交换机硬件,工作在 NVLink 协议层之上,用来实现高性能、低延迟、全互联的 GPU 通信。让 GPU 之间可以非常高效地通信(不仅限于几个 GPU,而是大规模 GPU 系统),并且支持集体通信优化(SHARP)。

2.2下载nvidia-fabricmanager

继续打开上面的nvidia官网驱动页面
nvidia官网驱动下载地址

按照你的卡型号下载rpm离线驱动


2.3安装nvidia-fabricmanager

下载完成后放到服务器上后执行命令:

bash 复制代码
rpm -i nvidia-driver-local-repo-rhel8-580.105.08-1.0-1.x86_64.rpm
dnf clean all
dnf -y module install nvidia-driver:latest-dkms

一般情况下会在"/var"目录下有一个"/var/nvidia-driver-local-repo-rhel8-580.105.08"目录

在这个目录下找到nvidia-fabricmanager开头的rpm文件

我的这个版本名字叫"nvidia-fabricmanager-580.105.08-1.x86_64.rpm"

执行

bash 复制代码
rpm -ivh nvidia-fabricmanager-580.105.08-1.x86_64.rpm

安装完成后即可

IB网络驱动

2.安装NVSwitch

还是登陆nvidia官网下载驱动

nvidia官网驱动下载地址

解压后直接执行install即可

相关推荐
数厘6 小时前
2.7SQL 四大分类:理解与避坑
数据库·sql
何中应6 小时前
如何给虚拟机系统扩容
linux·运维·服务器
亮子AI6 小时前
【PostgreSQL】推荐几个PostgreSQL管理工具
数据库·postgresql
AI应用实战 | RE6 小时前
011、向量数据库入门:Embeddings原理与ChromaDB实战
开发语言·数据库·langchain·php
captain3767 小时前
联合查询
数据库
华农DrLai7 小时前
怎么用大模型生成推荐的训练数据?Data Augmentation怎么做?
数据库·人工智能·大模型·nlp·prompt
沐雪轻挽萤7 小时前
无人系统:Ubuntu 操作系统全景架构与实战工程指南
linux·运维·ubuntu
XDHCOM7 小时前
ORA-31215: DBMS_LDAP PL/SQL无效LDAP修改值,Oracle报错故障修复与远程处理方案,快速解决连接配置难题
数据库·sql·oracle
白緢7 小时前
嵌入式 Linux + 内核开发高频问题及排查
java·linux·运维
学编程就要猛7 小时前
JavaEE初阶:网络编程
运维·服务器·网络