【Docker】Docker 中不能使用 nvidia-smi

目录

[1. 问题](#1. 问题)

[2. 解决方法](#2. 解决方法)


1. 问题

在 docker 中执行 nvidia-smi 后报错:

Failed to initialize NVML: Unknown Error

这个错误表示不能成功初始化NVML(Nvidia Management Library)库来管理和监测Nvidia GPU。可能的原因和解决方法如下:

  • 检查是否正确安装并加载了Nvidia的驱动。需要安装对应GPU型号的驱动包。

  • 检查docker容器是否正确映射了Nvidia设备。需要使用"--runtime=nvidia"和"-gpus all"参数启动容器。

  • 检查容器内是否安装了Nvidia的容器运行时(nvidia-container-runtime)包。

  • 检查主机与容器内部Linux内核版本是否兼容。需要主机和容器使用相同版本的内核。

  • 清除docker所有图像并重新构建容器。可能遗留的旧配置导致问题。

  • 重建docker服务,或重新启动Nvidia驱动。

  • 检查NVML本身是否损坏。可以尝试重新安装或者卸载后重新安装NVML相关依赖包。

  • 升级Nvidia驱动和硬件到最新版本,排除不兼容问题。

2. 解决方法

修改 docker 所在服务器的

 /etc/nvidia-container-runtime/config.toml

中的参数为

no-cgroups = false
相关推荐
volcanical32 分钟前
Dataset Distillation with Attention Labels for Fine-tuning BERT
人工智能·深度学习·bert
L_cl32 分钟前
【NLP 17、NLP的基础——分词】
人工智能·自然语言处理
西西弗Sisyphus34 分钟前
大型语言模型(LLMs)演化树 Large Language Models
人工智能·语言模型·自然语言处理·大模型
鲁正杰35 分钟前
在一个服务器上抓取 Docker 镜像并在另一个服务器上运行
运维·服务器·docker
aherhuo1 小时前
基于openEuler22.09部署OpenStack Yoga云平台(一)
linux·运维·服务器·openstack
WebDeveloper20011 小时前
如何使用美国域名中心US Domain Center和WordPress创建商业网站
运维·服务器·css·网络·html
老大白菜1 小时前
Windows 11 安装 Dify 完整指南 非docker环境
windows·docker·容器
檀越剑指大厂2 小时前
【Linux系列】Shell 脚本中的条件判断:`[ ]`与`[[ ]]`的比较
linux·运维·服务器
车载诊断技术2 小时前
电子电气架构 --- 什么是EPS?
网络·人工智能·安全·架构·汽车·需求分析
KevinRay_3 小时前
Python超能力:高级技巧让你的代码飞起来
网络·人工智能·python·lambda表达式·列表推导式·python高级技巧