CUDA索引越界问题(Compile with `TORCH_USE_CUDA_DSA` to enable device-side assertions)

一年以来,主要从事了时空模型的研究。去年6月份发布了一篇文章也是关于CUDA索引越界问题的博客,只不过报错的信息不一样。这次是Compile with `TORCH_USE_CUDA_DSA` to enable device-side assertions。上网搜索了一下,发现有很多人遇到这样的问题。但是原因不一,让我意识到这个错误的复杂性。

有的说是:显存不足,需要通过降低batch size解决;

有的说是:数据集导入错误;

各种问题总结下来,如果是显存问题,那确实是硬伤,但更多的是由于运算或逻辑错误,这可能确实由数据集引起的,也可能是代码计算过程中产生的。所以遇到这种问题最重要的是静下心来分析出错的位置和所涉及到的数据和运算 。因此,如何找到出错位置,还是请参考我上一篇文章:https://blog.csdn.net/qq_45767840/article/details/148700059?spm=1011.2124.3001.6209

这里的第一步是找到问题所在的关键。

为什么我还要再写一遍,因为我这次错误的原因,确实是因为图结构一行全0了。这次找到具体原因了。也发现我的这两篇文章的索引越界都是和时空模型常见错误相关,如果你运行的其他模型报此错误,解决这个错误的思想还是很重要的。

相关推荐
小程故事多_8013 小时前
生产级大模型应用后端架构设计指南(从入门到实战)
人工智能·架构·智能体
Championship.23.2413 小时前
AI驱动的网络安全革命:威胁检测与防御实战指南
人工智能·安全·web安全
Swift社区13 小时前
OpenClaw:AI 多线程时代的开始
人工智能·ai·openclaw
Mr数据杨13 小时前
【Codex】用知识点配置模块构建考试与教学知识图谱
人工智能·django·知识图谱·codex·项目开发
幂律智能13 小时前
法律人的AI技术词典:从LLM到Agent
大数据·人工智能
LaughingZhu13 小时前
Product Hunt 每日热榜 | 2026-05-09
人工智能·经验分享·深度学习·神经网络·产品运营
罗小罗同学14 小时前
华西医院联合多伦多大学、盛京医院等机构发布多模态智能体检索模型,实现 AI 循证推理全链条权威可溯
大数据·人工智能·机器学习·医工交叉·医学ai
研究点啥好呢14 小时前
途游游戏AI产品经理面试题精选:10道高频考题+答案解析
人工智能·游戏·产品经理
KG_LLM图谱增强大模型14 小时前
从数据孤岛到知识融合:用友大型本体模型LOM如何赋能企业知识管理和智能决策
人工智能·知识图谱
码以致用14 小时前
用 DeepAgents 自动分析表格数据,一键生成图表与报告
人工智能·ai编程