GPU分配BUG: Duplicate GPU detected : rank 1 and rank 0 both on CUDA device d5000

#BUG

bash 复制代码
[rank1]: Last error:
[rank1]: Duplicate GPU detected : rank 1 and rank 0 both on CUDA device d5000

解决

添加

bash 复制代码
   if th.cuda.is_available():
       local_rank = comm.rank % th.cuda.device_count()
       th.cuda.set_device(local_rank)
       os.environ["LOCAL_RANK"] = str(local_rank)
        
相关推荐
johnny23317 小时前
运维管理面板:AcePanel、OpenOcta、DeepSentry
运维
青梅橘子皮17 小时前
Linux---基本指令
linux·运维·服务器
REDcker18 小时前
Linux信号机制详解 POSIX语义与内核要点 sigaction与备用栈实践
linux·运维·php
cui_ruicheng19 小时前
Linux进程间通信(三):System V IPC与共享内存
linux·运维·服务器
蚰蜒螟19 小时前
深入 Linux 内核同步机制:从 futex 到 spinlock 的完整旅程
linux·windows·microsoft
运维全栈笔记19 小时前
Linux安装配置Tomcat保姆级教程:从部署到性能调优
linux·服务器·中间件·tomcat·apache·web
dllmayday20 小时前
Linux 上用终端连接 WiFi
linux·服务器·windows
ACP广源盛1392462567320 小时前
IX8024与科学大模型的碰撞@ACP#筑牢科研 AI 算力高速枢纽分享
运维·服务器·网络·数据库·人工智能·嵌入式硬件·电脑
峥无21 小时前
Linux系统编程基石:静态库·动态库·ELF文件·进程地址空间全景图
linux·运维·服务器
用户2367829801681 天前
从 chmod 755 说起:Unix 文件权限到底是怎么算的?
linux