NVIDIA-SMI has failed because it couldn“t communicate with the NVIDIA driver .

文章目录

报错

  1. 执行nvidia-smi报错

    NVIDIA-SMI has failed because it couldn"t communicate with the NVIDIA driver .
    Make sure that the atest NVIDIA driver is installed and running.

  2. 运行使用gpu的docker容器时

    NVIDIA Docker - initialization error: nvml error: driver not loaded

原因分析

  1. 大概率是因为重启后内核升级了 (起码我的问题是因为这样)。
  2. 驱动文件被删除

解决办法

  1. 查看显卡连接是否正常
sh 复制代码
$ sudo lshw -C display

应该会输出

  1. 查看已安装内核
sh 复制代码
$ dpkg --get-selections |grep linux-image
  1. 查看在使用内核
sh 复制代码
$ uname -a

如果本地有多核内核大概可能是因为内核升级导致驱动无法识别

  1. 查看本地之前安装的驱动版本
sh 复制代码
$ ls /usr/src | grep nvidia

输出:nvidia-515.105.01 (记住:515.105.01 这个版本号)

5... 此时只需要执行

复制代码
$ sudo apt-get install dkms
$ sudo dkms install -m nvidia -v 515.105.01(515.105.01表示的是驱动版本号,上面查到的)
  1. 此时应该是解决了此问题
sh 复制代码
$ nvidia-smi

可以看到gpu的列表

防患于未然

1)命令行关闭系统自动更新,使用命令打开文件并编辑

sh 复制代码
$ sudo gedit /etc/apt/apt.conf.d/10periodic

将双引号中的"1"全部置"0"即可,修改后保存。

相关推荐
weixin_4624462315 分钟前
使用 jsr:@langchain/pyodide-sandbox 构建 Python 安全沙箱(完整入门教程)
python·安全·langchain·sandbox
Loo国昌33 分钟前
【LangChain1.0】第九阶段:文档处理工程 (LlamaIndex)
人工智能·后端·python·算法·langchain
抠头专注python环境配置1 小时前
基于Python与深度学习的智能垃圾分类系统设计与实现
pytorch·python·深度学习·分类·垃圾分类·vgg·densenet
愈努力俞幸运1 小时前
flask 入门 token, headers,cookie
后端·python·flask
梦想是成为算法高手2 小时前
带你从入门到精通——知识图谱(一. 知识图谱入门)
人工智能·pytorch·python·深度学习·神经网络·知识图谱
用什么都重名2 小时前
Conda 虚拟环境安装配置路径详解
windows·python·conda
阿也在北京2 小时前
基于Neo4j和TuGraph的知识图谱与问答系统搭建——胡歌的导演演员人际圈
python·阿里云·知识图谱·neo4j
计算机徐师兄2 小时前
Python基于知识图谱的胆囊炎医疗问答系统(附源码,文档说明)
python·知识图谱·胆囊炎医疗问答系统·python胆囊炎医疗问答系统·知识图谱的胆囊炎医疗问答系统·python知识图谱·医疗问答系统
北冥码鲲2 小时前
【保姆级教程】从零入手:Python + Neo4j 构建你的第一个知识图谱
python·知识图谱·neo4j