CUDA索引越界问题(Compile with `TORCH_USE_CUDA_DSA` to enable device-side assertions)

一年以来,主要从事了时空模型的研究。去年6月份发布了一篇文章也是关于CUDA索引越界问题的博客,只不过报错的信息不一样。这次是Compile with `TORCH_USE_CUDA_DSA` to enable device-side assertions。上网搜索了一下,发现有很多人遇到这样的问题。但是原因不一,让我意识到这个错误的复杂性。

有的说是:显存不足,需要通过降低batch size解决;

有的说是:数据集导入错误;

各种问题总结下来,如果是显存问题,那确实是硬伤,但更多的是由于运算或逻辑错误,这可能确实由数据集引起的,也可能是代码计算过程中产生的。所以遇到这种问题最重要的是静下心来分析出错的位置和所涉及到的数据和运算 。因此,如何找到出错位置,还是请参考我上一篇文章:https://blog.csdn.net/qq_45767840/article/details/148700059?spm=1011.2124.3001.6209

这里的第一步是找到问题所在的关键。

为什么我还要再写一遍,因为我这次错误的原因,确实是因为图结构一行全0了。这次找到具体原因了。也发现我的这两篇文章的索引越界都是和时空模型常见错误相关,如果你运行的其他模型报此错误,解决这个错误的思想还是很重要的。

相关推荐
这张生成的图像能检测吗2 小时前
(论文速读)TCN:序列建模不一定需要 RNN
人工智能·深度学习·transformer·卷积·时序预测
大师影视解说2 小时前
基于Web端的AI电影解说自动化生产工具实测:4步完成从文案到成片的全流程
运维·人工智能·自动化·影视解说·电影解说工具·网页版电影解说·ai电影解说
是大强2 小时前
GaN器件
人工智能·神经网络·生成对抗网络
美狐美颜sdk2 小时前
从人脸关键点到动态贴图:面具特效在美颜SDK中的实现原理
前端·图像处理·人工智能·直播美颜sdk·美颜api
威联通网络存储3 小时前
告别掉帧与素材损毁:威联通 QuTS hero 如何重塑影视后期协同工作流
前端·网络·人工智能·python
chaser&upper3 小时前
【一起啃西瓜书】机器学习-期末复习(不挂科)
人工智能·机器学习·期末复习·学霸笔记
瓜瓜学Java3 小时前
机器学习深度学习基础速成
人工智能·机器学习
d3y13 小时前
机器学习之策略梯度
人工智能·机器学习·策略梯度·policy gradient
希潭实验室3 小时前
第136篇:美国NSA的苹果手机“三角测量“后门的窃密模块分析 | 机器学习引擎识别照片信息
人工智能·机器学习·智能手机