旧 docker 版本通过 nvkind 搭建虚拟多节点 gpu 集群的坑

踩坑

参考nvkind教程安装到Setup这一步,由于docker版本较旧,--cdi.enabled 和 config 参数执行不了

手动修改 /etc/docker/daemon.json 配置文件

复制代码
    "features": {
        "cdi": true
    }

手动修改 /etc/nvidia-container-runtime/config.toml 配置文件

复制代码
accept-nvidia-visible-devices-as-volume-mounts = true

然后再重启 docker

相关推荐
开开心心就好5 分钟前
发票合并打印工具,多页布局设置实时预览
linux·运维·服务器·windows·pdf·harmonyos·1024程序员节
火车叼位25 分钟前
脚本伪装:让 Python 与 Node.js 像原生 Shell 命令一样运行
运维·javascript·python
迎仔1 小时前
06-存储设备运维进阶:算力中心的存储管家
运维
?re?ta?rd?ed?1 小时前
linux中的调度策略
linux·运维·服务器
全栈工程师修炼指南1 小时前
Nginx | stream content 阶段:TCP 协议四层反向代理浅析与实践
运维·网络·网络协议·tcp/ip·nginx
hweiyu001 小时前
Linux 命令:tr
linux·运维·服务器
Trouvaille ~1 小时前
【Linux】应用层协议设计实战(一):自定义协议与网络计算器
linux·运维·服务器·网络·c++·http·应用层协议
allway21 小时前
基于华为taishan200服务器、arm架构kunpeng920 cpu的虚拟化实战
linux·运维·服务器
CSCN新手听安1 小时前
【linux】高级IO,I/O多路转接之poll,接口和原理讲解,poll版本的TCP服务器
linux·运维·服务器·c++·计算机网络·高级io·poll
熊文豪1 小时前
服务器炸了才知道?Ward+cpolar让异常无处藏
运维·服务器·cpolar