从0到1安装NVIDIA驱动(NVSwitch+Driver+IB网络驱动)

1.安装NVIDIA Driver

1.1 下载NVIDIA Driver文件


PS:本文以run文件为安装步骤设置

按照截图步骤下载以下的驱动

打开网址:
nvidia官网驱动下载地址

找到这个驱动页面

下载最新的驱动

放到服务器中

如果没有执行权限可以添加以下执行权限命令为:

bash 复制代码
chmod a+x NVIDIA-Linux-x86_64-580.95.05.run

直接执行

bash 复制代码
./NVIDIA-Linux-x86_64-580.95.05.run

点击nvidia proprietary

安装完成后即可执行命令

bash 复制代码
nvidia-smi

驱动安装完毕

2.安装NVSwitch

2.1它是什么?

NVSwitch 是连接多 GPU 的交换机硬件,工作在 NVLink 协议层之上,用来实现高性能、低延迟、全互联的 GPU 通信。让 GPU 之间可以非常高效地通信(不仅限于几个 GPU,而是大规模 GPU 系统),并且支持集体通信优化(SHARP)。

2.2下载nvidia-fabricmanager

继续打开上面的nvidia官网驱动页面
nvidia官网驱动下载地址

按照你的卡型号下载rpm离线驱动


2.3安装nvidia-fabricmanager

下载完成后放到服务器上后执行命令:

bash 复制代码
rpm -i nvidia-driver-local-repo-rhel8-580.105.08-1.0-1.x86_64.rpm
dnf clean all
dnf -y module install nvidia-driver:latest-dkms

一般情况下会在"/var"目录下有一个"/var/nvidia-driver-local-repo-rhel8-580.105.08"目录

在这个目录下找到nvidia-fabricmanager开头的rpm文件

我的这个版本名字叫"nvidia-fabricmanager-580.105.08-1.x86_64.rpm"

执行

bash 复制代码
rpm -ivh nvidia-fabricmanager-580.105.08-1.x86_64.rpm

安装完成后即可

IB网络驱动

2.安装NVSwitch

还是登陆nvidia官网下载驱动

nvidia官网驱动下载地址

解压后直接执行install即可

相关推荐
倔强的石头_3 分钟前
《Kingbase护城河》——猎捕慢查询:执行计划的微观解析与索引调优实战
数据库
SelectDB2 小时前
Apache Doris Python UDF:让 SQL 直接调用 Python 生态,支撑 Agent 时代复杂业务逻辑
大数据·数据库·python
SkyWalking中文站5 小时前
认识 Horizon UI · 5/17:3D 基础设施地图
运维·监控·自动化运维
SkyWalking中文站1 天前
认识 Horizon UI · 1/17:SkyWalking 新一代可观测性控制台
运维·前端·监控
雪梨酱QAQ1 天前
Kubeneters HA Cluster部署
运维
jiayou641 天前
KingbaseES 表级与列级加密完全指南
数据库·后端
江华森1 天前
Spring Cloud 微服务全栈实战:从 Eureka 到 Docker Compose 一文贯通
运维
江华森1 天前
Matplotlib 数据绘图基础入门
运维
江华森1 天前
NumPy 数值计算基础入门
运维
GBASE2 天前
G术时刻 |GBase 8s数据库事务并发控制之封锁技术介绍(下)
数据库