前言
给实验室服务器安装显卡驱动,总是遇到各种各样的问题。故而专门开一个文章记录一下遇到的各类问题。
正常安装方法
在这里安装CUDA,选择最新版本后根据系统配置点选即可,会自动生成对应的链接,如下图。这里选runfile,里面打包好了所需的软件。直接装CUDA一是实验室跑AI算法需要,另一个是安装的时候会提示是否安装显卡驱动的。
然后按网页的要求wget、sh即可。运行后输入accept,然后选install啥的即可。
或者,在这里仅下载驱动。
各类问题汇总
实际中可能因为各种问题导致安装失败。失败时,console会提示查看log文件,可以根据日志信息了解下错误类型。
Nouveau kernel driver驱动问题
ERROR: The Nouveau kernel driver is currently in use by your system. This driver is incompatible with the NVIDIA driver, and must be disabled before proceeding. Please consult the NVIDIA driver README and your Linux distribution's documentation for details on how to correctly disable the Nouveau kernel driver.
shell
sudo vi /etc/modprobe.d/blacklist-nouveau.conf
向其中写入
blacklist nouveau
options nouveau modeset=0
然后更新内核
shell
sudo update-initramfs -u
最后重启
shell
sudo reboot
Nvidia-drm无法加载问题(待确认)
模块被其他应用程序占用
shell
sudo systemctl isolate multi-user.target
sudo modprobe -r nvidia-drm