pytorch模型训练使用多GPU执行报错:Bus error (core dumped)(未解决)

问题信息

使用 cuda 进行训练

使用 4 个GPU进行训练

Epoch [1/20]: 0%| | 0/3184 [00:00<?, ?it/s]Bus error (core dumped)

执行方式

python 复制代码
 self.model = nn.DataParallel(self.model)
 self.model = self.model.to(self.device)

4张GPU均正常,单独指定使用任何一张都可正常执行,运行内存够大,但是一启动4GPU,4张显卡刚起来就error

相关推荐
阿Y加油吧几秒前
回溯法经典难题:N 皇后问题 深度解析 + 二分查找入门(搜索插入位置)
开发语言·python
leo_messi945 分钟前
2026版商城项目(三)-- ES+认证服务
后端·python·django
墨染天姬10 分钟前
【AI】如何基于cursor创建MCP索引pdf
人工智能·pdf
数字供应链安全产品选型12 分钟前
AI造“虾”易,治理难?悬镜多模态 SCA 技术破局 AI 数字供应链治理困局!
人工智能·安全·网络安全·ai-native
火山引擎开发者社区13 分钟前
只需聊聊天,应用就上线:ArkClaw 对话开发与 IGA Pages 极速部署实践
人工智能
昨夜见军贴061615 分钟前
AI报告编审解决方案重塑工作节奏:IA-Lab AI检测报告生成助手与IACheck让报告处理从紧张走向从容
人工智能
芯智工坊15 分钟前
第13章 Mosquitto监控与日志管理
前端·网络·人工智能·mqtt·开源
扬帆破浪17 分钟前
开源的WPS AI文档编审软件适用场景:察元 AI 文档助手
人工智能·开源
NPE~23 分钟前
[App逆向]环境搭建下篇 — — 逆向源码+hook实战
android·javascript·python·教程·逆向·hook·逆向分析
爱学习的小仙女!23 分钟前
机器学习面试题(二) 损失函数 常见损失函数
人工智能·机器学习