从0到1安装NVIDIA驱动(NVSwitch+Driver+IB网络驱动)

1.安装NVIDIA Driver

1.1 下载NVIDIA Driver文件


PS:本文以run文件为安装步骤设置

按照截图步骤下载以下的驱动

打开网址:
nvidia官网驱动下载地址

找到这个驱动页面

下载最新的驱动

放到服务器中

如果没有执行权限可以添加以下执行权限命令为:

bash 复制代码
chmod a+x NVIDIA-Linux-x86_64-580.95.05.run

直接执行

bash 复制代码
./NVIDIA-Linux-x86_64-580.95.05.run

点击nvidia proprietary

安装完成后即可执行命令

bash 复制代码
nvidia-smi

驱动安装完毕

2.安装NVSwitch

2.1它是什么?

NVSwitch 是连接多 GPU 的交换机硬件,工作在 NVLink 协议层之上,用来实现高性能、低延迟、全互联的 GPU 通信。让 GPU 之间可以非常高效地通信(不仅限于几个 GPU,而是大规模 GPU 系统),并且支持集体通信优化(SHARP)。

2.2下载nvidia-fabricmanager

继续打开上面的nvidia官网驱动页面
nvidia官网驱动下载地址

按照你的卡型号下载rpm离线驱动


2.3安装nvidia-fabricmanager

下载完成后放到服务器上后执行命令:

bash 复制代码
rpm -i nvidia-driver-local-repo-rhel8-580.105.08-1.0-1.x86_64.rpm
dnf clean all
dnf -y module install nvidia-driver:latest-dkms

一般情况下会在"/var"目录下有一个"/var/nvidia-driver-local-repo-rhel8-580.105.08"目录

在这个目录下找到nvidia-fabricmanager开头的rpm文件

我的这个版本名字叫"nvidia-fabricmanager-580.105.08-1.x86_64.rpm"

执行

bash 复制代码
rpm -ivh nvidia-fabricmanager-580.105.08-1.x86_64.rpm

安装完成后即可

IB网络驱动

2.安装NVSwitch

还是登陆nvidia官网下载驱动

nvidia官网驱动下载地址

解压后直接执行install即可

相关推荐
杨靳言先5 小时前
✨【运维实战】内网服务器无法联网?巧用 SSH 隧道实现反向代理访问公网资源 (Docker/PortForwarding)
服务器·docker·ssh
二哈喇子!5 小时前
MySQL数据更新操作
数据库·sql
二哈喇子!5 小时前
MySQL命令行导入数据库
数据库·sql·mysql·vs code
心动啊1215 小时前
SQLAlchemy 的使用
数据库
Justice link6 小时前
K8S基本配置
运维·docker·容器
观熵6 小时前
SaaS 系统的自动化部署结构设计实战指南:基于 K8s + Helm 的工程落地路径
运维·kubernetes·自动化·saas 架构
chinesegf6 小时前
ubuntu中虚拟环境的简单创建和管理
linux·运维·ubuntu
若涵的理解6 小时前
一文读懂K8S kubectl 命令,运维小白必看!
运维·docker·kubernetes
曾经的三心草6 小时前
redis-2-数据结构内部编码-单线程-String命令
数据结构·数据库·redis
java_logo6 小时前
2025 年 11 月最新 Docker 镜像源加速列表与使用指南
linux·运维·docker·容器·运维开发·kylin