debian&ubuntu的nvidia驱动升级

背景

给出的机器的驱动版本不符合要求,使用自定义的驱动版本。

前置

如果使用nvidia官方的.run安装的驱动包,可以使用系统自带的nvidia-uninstall命令卸载比较方便,不建议使用apt pruge nvidia-*命令删除。会带来其他的问题。

卸载完成之后重启一下机器,验证两个问题

  1. 没有软件使用nvida-driver
  2. 内核模块没有被加载

否则后面安装会有一些报错

验证

bash 复制代码
lsof /dev/nvidia*

把正在使用nvidia的软件停止或者卸载。

bash 复制代码
lsmod |grep nvidia

预期结果:输出为空。

如果不是空,比如下面这种输出,确认没有软件使用nvidia之后,重启一下系统。手动使用rmmod module_name删除内核模块不推荐。

bash 复制代码
nvidia_uvm           1511424  0
nvidia_drm             90112  0
nvidia_modeset       1331200  1 nvidia_drm
drm_kms_helper        217088  4 cirrus,nvidia_drm
nvidia              56201216  2 nvidia_uvm,nvidia_modeset
drm                   548864  5 drm_kms_helper,nvidia,cirrus,nvidia_drm

安装

从官网下载.run的驱动包,赋予执行权限,安装。

遇到的报错

ERROR: An NVIDIA kernel module 'nvidia-uvm' appears to already be loaded in your kernel. This may be because it is in use (for example, by an X server, a CUDA program, or the NVIDIA Persistence Daemon), but this may also happen if your kernel was configured without support for module unloading. Please be sure to exit any programs that may be using the GPU(s) before attempting to upgrade your driver. If no GPU-based programs are running, you know that your kernel supports module unloading, and you still receive this message, then an error may have occurred that has corrupted an NVIDIA kernel module's usage count, for which the simplest remedy is to reboot your computer.

ERROR: Installation has failed. Please see the file '/var/log/nvidia-installer.log' for details. You may find suggestions on fixing installation problems in the README available on the Linux

driver download page at www.nvidia.com.

The nvidia-installer program was found on this system. This is probably left over from an earlier installation of the non-free NVIDIA graphics driver, installed using the NVIDIA *.run file directly. This installation is incompatible with the Debian packages. To install the Debian packages safely, it is therefore necessary to undo the changes performed by nvidia-installer

apt安装时报错FCAE110B1118213C没有这个key

bash 复制代码
apt-key adv --keyserver keyserver.ubuntu.com --recv-keys FCAE110B1118213C

refer

nvidia驱动下载地址

https://www.nvidia.com/Download/index.aspx?lang=en-us

驱动文档

https://docs.nvidia.com/datacenter/tesla/index.html

相关推荐
wangqiaowq6 小时前
windows下nginx的安装
linux·服务器·前端
cen__y8 小时前
Linux12(Git01)
linux·运维·服务器·c语言·开发语言·git
不仙5209 小时前
VMware Workstation 26.0.0 在 Ubuntu 24.04 (内核 6.17.0) 上的安装与内核模块编译问题
linux·ubuntu·elasticsearch
1892280486110 小时前
NY352固态MT29F32T08GWLBHD6-24QJ:B
大数据·服务器·人工智能·科技·缓存
AI视觉网奇10 小时前
linux 检索库 判断库是否支持
java·linux·服务器
dapeng-大鹏10 小时前
KVM+LVM 零停机在线扩容 Ubuntu 根分区:从磁盘添加到逻辑卷扩展完整
linux·运维·ubuntu·磁盘空间扩展
一楼的猫11 小时前
从工具链视角对比:番茄作家助手 vs 第三方写作辅助方案
java·服务器·开发语言·前端·学习·chatgpt·ai写作
武子康11 小时前
调查研究-138 全球机器人产业深度调研报告【01 篇】:市场规模、竞争格局与商业化成熟 2026
服务器·数据库·ai·chatgpt·机器人·具身智能
xhbh66612 小时前
代理ARP (Proxy ARP) 是如何实现跨网段通信的?在Linux下如何配置?
服务器·网络·智能路由器·端口映射·映射
Elastic 中国社区官方博客13 小时前
快 12 倍的 Elasticsearch 向量索引:使用 GPU 和 CPU 分层部署 NVIDIA cuVS
大数据·人工智能·elasticsearch·搜索引擎·ai·全文检索·nvidia