Pytorch报错RuntimeError: CUDA error: device-side assert triggered

参考:

  • https://blog.csdn.net/BetrayFree/article/details/134267306

完整报错如下:

shell 复制代码
Traceback (most recent call last):
  File "/home/yingmuzhi/SpecML2/test.py", line 150, in <module>
    trainer.fit(model, data)
  File "/home/yingmuzhi/SpecML2/core.py", line 486, in fit
    self.fit_epoch()
  File "/home/yingmuzhi/SpecML2/core.py", line 496, in fit_epoch
    loss = self.model.training_step(self.prepare_batch(batch))
           ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
  File "/home/yingmuzhi/SpecML2/core.py", line 394, in training_step
    self.plot('loss', l, train=True)
  File "/home/yingmuzhi/SpecML2/core.py", line 384, in plot
    self.board.draw(x, value.to(cpu()).detach().numpy(),
                       ^^^^^^^^^^^^^^^
RuntimeError: CUDA error: device-side assert triggered
CUDA kernel errors might be asynchronously reported at some other API call, so the stacktrace below might be incorrect.
For debugging consider passing CUDA_LAUNCH_BLOCKING=1.
Compile with `TORCH_USE_CUDA_DSA` to enable device-side assertions.

有很多愿意会导致这个CUDA triggered的Error,我的问题是在于网络前半部分都是卷积层,在最后一层使用了全连接层,而在最后一层我的输出并没有和类别相匹配。例如,原先多分类我用的是十个类别,更改成二十二种类别后忘记改输出的类别了,将类别和输出channel相匹配便解决了。

相关推荐
璞华Purvar12 小时前
投后管理系统全解析:核心功能、应用场景与落地价值(2026年)
大数据·人工智能·物联网
cuiyz crazy12 小时前
Vibe Coding的困境
人工智能
belldeep12 小时前
基于深度学习的中医辨证系统 如何区分各种感冒?
人工智能·深度学习·ai·中医辨证
古怪今人12 小时前
大语言模型(LLM)的开发流程 训练、微调和RAG时什么改变了
人工智能·语言模型·自然语言处理
Dev7z12 小时前
基于卷积神经网络(CNN)的脑电信号分类及可解释性分析
人工智能·分类·cnn
djjdjdjdjjdj12 小时前
Redis怎样追踪系统执行的缓慢操作.txt
jvm·数据库·python
ToTensor12 小时前
Mem0 深度解析:智能记忆层的架构原理
人工智能·agent·memory
heiqizero12 小时前
spark01-创建RDD
linux·前端·python
老歌老听老掉牙12 小时前
Python 错误处理:从基础语法到工程级实践的完整指南
python·错误处理
Kingairy12 小时前
自然语言处理基础-自然语言处理概览
人工智能·语音识别