pytorch模型训练使用多GPU执行报错:Bus error (core dumped)(未解决)

问题信息

使用 cuda 进行训练

使用 4 个GPU进行训练

Epoch 1/20: 0%| | 0/3184 00:00\Bus error (core dumped)

执行方式

python 复制代码
 self.model = nn.DataParallel(self.model)
 self.model = self.model.to(self.device)

4张GPU均正常,单独指定使用任何一张都可正常执行,运行内存够大,但是一启动4GPU,4张显卡刚起来就error

相关推荐
threerocks1 天前
神级 Skill,作品个个儿爆,我开源了长期自用的手绘风格库
人工智能·aigc
小爷毛毛_卓寿杰1 天前
我把一个 3B 模型塞进了 Xinference,然后它干掉了 DeepSeek V3.2
人工智能·开源·github
秦先生在广东1 天前
Agent 闭环才是真正的护城河:Anthropic “300 个 Agent“ 背后被忽视的秘密
人工智能
Bigfish_coding1 天前
前端转agent-【python】- 14 记忆系统优化:摘要与遗忘
人工智能
Bigfish_coding1 天前
前端转agent-【python】-13 Ollama Python流式输出教程:stream=True 与 async 实践
人工智能
ZhengEnCi1 天前
P2M-Matplotlib折线图完全指南-从数据可视化到趋势分析的Python绘图利器
python·matlab·数据可视化
字节跳动数据库1 天前
文章分享——相似函数处理方法
人工智能·后端·程序员
Bigfish_coding1 天前
前端转agent-【python】-12 LangChain 入门实战:RAG + LCEL 链式调用
人工智能
程序员cxuan1 天前
读懂 Claude Code 架构分析系列,第一篇,开始!
人工智能·后端·架构
ZhengEnCi1 天前
P2L-Matplotlib饼图完全指南-从数据可视化到图表定制的Python绘图利器
python·matlab