从0到1安装NVIDIA驱动(NVSwitch+Driver+IB网络驱动)

1.安装NVIDIA Driver

1.1 下载NVIDIA Driver文件


PS:本文以run文件为安装步骤设置

按照截图步骤下载以下的驱动

打开网址:
nvidia官网驱动下载地址

找到这个驱动页面

下载最新的驱动

放到服务器中

如果没有执行权限可以添加以下执行权限命令为:

bash 复制代码
chmod a+x NVIDIA-Linux-x86_64-580.95.05.run

直接执行

bash 复制代码
./NVIDIA-Linux-x86_64-580.95.05.run

点击nvidia proprietary

安装完成后即可执行命令

bash 复制代码
nvidia-smi

驱动安装完毕

2.安装NVSwitch

2.1它是什么?

NVSwitch 是连接多 GPU 的交换机硬件,工作在 NVLink 协议层之上,用来实现高性能、低延迟、全互联的 GPU 通信。让 GPU 之间可以非常高效地通信(不仅限于几个 GPU,而是大规模 GPU 系统),并且支持集体通信优化(SHARP)。

2.2下载nvidia-fabricmanager

继续打开上面的nvidia官网驱动页面
nvidia官网驱动下载地址

按照你的卡型号下载rpm离线驱动


2.3安装nvidia-fabricmanager

下载完成后放到服务器上后执行命令:

bash 复制代码
rpm -i nvidia-driver-local-repo-rhel8-580.105.08-1.0-1.x86_64.rpm
dnf clean all
dnf -y module install nvidia-driver:latest-dkms

一般情况下会在"/var"目录下有一个"/var/nvidia-driver-local-repo-rhel8-580.105.08"目录

在这个目录下找到nvidia-fabricmanager开头的rpm文件

我的这个版本名字叫"nvidia-fabricmanager-580.105.08-1.x86_64.rpm"

执行

bash 复制代码
rpm -ivh nvidia-fabricmanager-580.105.08-1.x86_64.rpm

安装完成后即可

IB网络驱动

2.安装NVSwitch

还是登陆nvidia官网下载驱动

nvidia官网驱动下载地址

解压后直接执行install即可

相关推荐
一瓢西湖水7 小时前
列式数据库-以clickHouse为例
数据库·clickhouse
Elastic 中国社区官方博客7 小时前
使用 Elastic Cloud Serverless 扩展批量索引
大数据·运维·数据库·elasticsearch·搜索引擎·云原生·serverless
liulanba7 小时前
AI Agent技术完整指南 第一部分:基础理论
数据库·人工智能·oracle
逆天小北鼻8 小时前
Oracle 服务端与客户端的核心区分要点
数据库·oracle
2501_946242938 小时前
MPV-EASY Player (MPV播放器) v0.41.0.1
数据库·经验分享·云计算·计算机外设·github·电脑·csdn开发云
超龄超能程序猿8 小时前
Docker GPU插件(NVIDIA Container Toolkit)安装
运维·docker·容器
Xの哲學8 小时前
Linux SMP 实现机制深度剖析
linux·服务器·网络·算法·边缘计算
2501_906150568 小时前
私有部署问卷系统操作实战记录-DWSurvey
java·运维·服务器·spring·开源
MySQL实战9 小时前
Redis 7.0 新特性之maxmemory-clients:限制客户端内存总使用量
数据库·redis
钦拆大仁9 小时前
单点登录SSO登录你了解多少
服务器·sso