问题信息
使用 cuda 进行训练
使用 4 个GPU进行训练
Epoch [1/20]: 0%| | 0/3184 [00:00<?, ?it/s]Bus error (core dumped)
执行方式
python
self.model = nn.DataParallel(self.model)
self.model = self.model.to(self.device)
4张GPU均正常,单独指定使用任何一张都可正常执行,运行内存够大,但是一启动4GPU,4张显卡刚起来就error