Linux操作系统安装nvidia-drives和nvidia-container-toolkit

一开始让AI写了一个Ansible脚本来初始化服务器,因为想起了12年前一起工作的小伙伴用Ansible配置管理服务器,于是想着应该没什么问题。

但是脚本实际运行后各种问题,特别是安装nvidia-drives和nvidia-container-toolkit。

以下是最后成功的方案

nvidia-drives

先禁用nouveau驱动

bash 复制代码
    # ---- 禁用 Nouveau 驱动 ----
    - name: 禁用 nouveau 开源驱动
      copy:
        dest: /etc/modprobe.d/blacklist-nouveau.conf
        content: |
          blacklist nouveau
          options nouveau modeset=0
        mode: "0644"

    - name: 重建 initramfs
      command: dracut --force
      changed_when: true

去英伟达的官网下载.run安装文件,选择自己适合的版本。

https://download.nvidia.com/XFree86/Linux-x86_64/

然后安装的时候会提示内核开发依赖缺失,安装命令如下

bash 复制代码
dnf install -y kernel-devel-$(uname -r)

我下载了NVIDIA-Linux-x86_64-575.57.08.run。

修改文件可以执行,然后运行

bash 复制代码
./NVIDIA-Linux-x86_64-575.57.08.run 

安装完成以后,运行nvidia-smi验证是否成功。

nvidia-container-toolkit

这个就要感谢国内的源了。

根据https://mirrors.ustc.edu.cn/help/libnvidia-container.html配置一个源,然后直接运行命令安装即可。

bash 复制代码
sudo yum install nvidia-container-toolkit
相关推荐
神の愛16 小时前
左连接查询数据 left join
java·服务器·前端
九皇叔叔16 小时前
Ubuntu 22.04 版本常用设置
linux·运维·ubuntu
南境十里·墨染春水16 小时前
linux学习进展 线程同步——互斥锁
java·linux·学习
杨云龙UP18 小时前
ODA登录ODA Web管理界面时提示Password Expired的处理方法_20260423
linux·运维·服务器·数据库·oracle
郑寿昌18 小时前
IIoT本体迁移的领域扩展机制
服务器·前端·microsoft
songx_9918 小时前
Linux基础2
linux·运维·服务器
我想要SSR18 小时前
搭建小龙虾过程和坑点
linux·服务器·ai
陈皮糖..19 小时前
27 届运维实习笔记|第三、四周:从流程熟练到故障排查,企业运维实战深化
运维·笔记·sql·nginx·ci/cd·云计算·jenkins
莫白媛19 小时前
Linux在限制敏感命令下的修改用户密码小白版
linux·运维·服务器
hhb_61820 小时前
C Shell 基础语法与高阶运维实战指南
运维·c语言·chrome