服务器——“查询不到显卡驱动,且输入nvidia-smi报错”的解决办法

一、报错内容:

复制代码
nvidia-smi

NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.


二、原因之一:

驱动模块没有被正确加载或当前内核与驱动不兼容。


三、详细的检查:

在服务器终端,输入以下检查命令:

c 复制代码
uname -a
lsb_release -a
nvidia-smi
dpkg -l | grep nvidia
lsmod | grep nvidia

将这些命令的输入一次性全部送入chatgpt,让chatgpt分析,然后确定最终的解决方案。


四、样例

博主将这些命令的输入一次性全部送入chatgpt后,下面是chatgpt的回复:

目前的问题是:

你当前的内核 6.14.0-27-generic 没有对应的 NVIDIA 内核模块,导致驱动未加载。


🧭 备选方案:回滚内核到 6.11.0-29

如果上面步骤失败,或编译失败,你也可以直接回滚内核:

  1. 查看是否已经安装旧内核:

    bash 复制代码
    dpkg --list | grep linux-image

    如果有 linux-image-6.11.0-29-generic 说明可以使用。

  2. 设置默认启动旧内核(无需显示器):

    编辑 grub:

    bash 复制代码
    sudo nano /etc/default/grub

    把这两行改为如下(注意版本号):

    bash 复制代码
    GRUB_DEFAULT="Advanced options for Ubuntu>Ubuntu, with Linux 6.11.0-29-generic"
    GRUB_TIMEOUT=2
  3. 更新 grub 并重启:

    bash 复制代码
    sudo update-grub
    sudo reboot

五、小贴士

在使用命令:

bash 复制代码
sudo nano /etc/default/grub

编辑 grub 文件时,是用 nano 编辑器 打开的。


✅ 在 nano 中退出并保存的方法如下:

🖊 如果你修改了内容并想保存退出
  1. 按下 Ctrl + O (即同时按下 Ctrl 和字母 O

    → 会提示你 "File Name to Write: /etc/default/grub"

  2. 直接按 Enter 回车(确认保存)

  3. 然后按下 Ctrl + X 退出编辑器


❌ 如果你不想保存修改,直接退出
  • 直接按下:Ctrl + X
  • 然后当它问你 "Save modified buffer (ANSWERING "No" WILL DESTROY CHANGES)?"
    → 输入 N(代表 No,不保存)即可退出
相关推荐
SkyWalking中文站16 小时前
认识 Horizon UI · 1/17:SkyWalking 新一代可观测性控制台
运维·前端·监控
雪梨酱QAQ19 小时前
Kubeneters HA Cluster部署
运维
江华森1 天前
Spring Cloud 微服务全栈实战:从 Eureka 到 Docker Compose 一文贯通
运维
江华森1 天前
Matplotlib 数据绘图基础入门
运维
江华森1 天前
NumPy 数值计算基础入门
运维
乘云数字DATABUFF5 天前
5分钟部署开源APM Databuff:OpenTelemetry全链路追踪入门实战
运维·后端
荣--7 天前
一键部署不是为了省时间 —— 它是把"买来的 PaaS"变成"自己的平台"的拐点
运维·zabbix·工程化·一键部署·平台化·边界设计
江华森7 天前
动手实战学 Docker — 从零到集群编排完全指南
运维
Avan_菜菜8 天前
FRP 内网穿透完整实战:从 HTTP 映射到 HTTPS 自签代理
运维·nginx·https
SelectDB9 天前
Litefuse 开源并推出单进程轻量模式,25 秒就能跑起来的 Agent 可观测与评估平台
运维·后端·自动化运维