Linux操作系统安装nvidia-drives和nvidia-container-toolkit

一开始让AI写了一个Ansible脚本来初始化服务器,因为想起了12年前一起工作的小伙伴用Ansible配置管理服务器,于是想着应该没什么问题。

但是脚本实际运行后各种问题,特别是安装nvidia-drives和nvidia-container-toolkit。

以下是最后成功的方案

nvidia-drives

先禁用nouveau驱动

bash 复制代码
    # ---- 禁用 Nouveau 驱动 ----
    - name: 禁用 nouveau 开源驱动
      copy:
        dest: /etc/modprobe.d/blacklist-nouveau.conf
        content: |
          blacklist nouveau
          options nouveau modeset=0
        mode: "0644"

    - name: 重建 initramfs
      command: dracut --force
      changed_when: true

去英伟达的官网下载.run安装文件,选择自己适合的版本。

https://download.nvidia.com/XFree86/Linux-x86_64/

然后安装的时候会提示内核开发依赖缺失,安装命令如下

bash 复制代码
dnf install -y kernel-devel-$(uname -r)

我下载了NVIDIA-Linux-x86_64-575.57.08.run。

修改文件可以执行,然后运行

bash 复制代码
./NVIDIA-Linux-x86_64-575.57.08.run 

安装完成以后,运行nvidia-smi验证是否成功。

nvidia-container-toolkit

这个就要感谢国内的源了。

根据https://mirrors.ustc.edu.cn/help/libnvidia-container.html配置一个源,然后直接运行命令安装即可。

bash 复制代码
sudo yum install nvidia-container-toolkit
相关推荐
戴为沐18 小时前
Linux内存扩容指南
linux
zylyehuo1 天前
Linux 彻底且安全地删除文件
linux
用户805533698032 天前
主线 U-Boot 上 RK3506:和闭源 rkbin 拔河的三个隐性契约
linux·嵌入式
用户034095297912 天前
linux fcitx 5 雾凇拼音 设置在中文输入法下仍然输入英文标点
linux
乘云数字DATABUFF2 天前
5分钟部署开源APM Databuff:OpenTelemetry全链路追踪入门实战
运维·后端
Web3探索者4 天前
可视化服务器管理和传统命令行区别是什么?新手教程:Linux 运维到底该用图形界面还是 SSH 命令行?
linux·ssh
zylyehuo4 天前
Linux系统中网线与USB网络共享冲突
linux
荣--4 天前
一键部署不是为了省时间 —— 它是把"买来的 PaaS"变成"自己的平台"的拐点
运维·zabbix·工程化·一键部署·平台化·边界设计
江华森4 天前
动手实战学 Docker — 从零到集群编排完全指南
运维
Avan_菜菜4 天前
FRP 内网穿透完整实战:从 HTTP 映射到 HTTPS 自签代理
运维·nginx·https