解决Pytorch的cuDNN error: CUDNN_STATUS_NOT_INITIALIZED

目录

  • [1. 问题报错](#1. 问题报错)
  • [2. 可能原因](#2. 可能原因)
    • [2.1 GPU内存不足](#2.1 GPU内存不足)
    • [2.2 缓存问题](#2.2 缓存问题)
    • [2.3 CUDA和Pytorch版本不兼容](#2.3 CUDA和Pytorch版本不兼容)
    • [2.4 CUDA和cuDNN版本不兼容](#2.4 CUDA和cuDNN版本不兼容)
  • [3. 验证CUDA是否可用](#3. 验证CUDA是否可用)
  • [4. 参考](#4. 参考)

1. 问题报错

在使用GPU加速模型训练的过程中经常会遇到这样的错误:

复制代码
RuntimeError: cuDNN error: CUDNN_STATUS_NOT_INITIALIZED

这个错误通常表示cuDNN库未能正确初始化。

2. 可能原因

2.1 GPU内存不足

在终端输入nvidia-smi查看GPU占用情况,如下图中的GPU 0几乎跑满,如果再使用该GPU运行其他占用内存较大的程序可能会报错。

复制代码
>>> nvidia-smi

2.2 缓存问题

有时,cuDNN错误可能是由于缓存问题引起的。尝试清除缓存,然后重新运行代码。可以在Python代码中使用以下代码来清除缓存:

python 复制代码
import torch
torch.cuda.empty_cache()

2.3 CUDA和Pytorch版本不兼容

不同版本的深度学习框架对CUDA和Pytorch的要求可能有所不同。在使用特定版本的框架时,查阅其文档或要求,了解所需的CUDA和Pytorch版本,并确保安装了正确的版本。

前往Pytorch官网查看版本对应关系:https://pytorch.org/get-started/previous-versions/,如果版本不匹配则需要重新安装Pytorch或者更新CUDA版本。注意同一Pytorch版本适配多个CUDA版本,具体还需要考虑cuDNN的版本,详情见下一节。

显卡的CUDA版本同样可以通过nvidia-smi进行查看:

2.4 CUDA和cuDNN版本不兼容

确保你使用的CUDA版本与cuDNN版本兼容,验证CUDA和cuDNN是否正确安装并配置。

cuDNN官网下载地址提供了二者版本对应关系:https://developer.nvidia.com/rdp/cudnn-archive

如果需要重新下载CUDA,可以前往官网下载:https://developer.nvidia.com/cuda-toolkit-archive

这篇博客记录了部分CUDA Toolkit 和cuDNN的版本对应关系:https://blog.csdn.net/tangjiahao10/article/details/125225786

3. 验证CUDA是否可用

查看CUDA是否可用命令如下:

python 复制代码
import torch
print(torch.cuda.is_available())

返回True即可用。

4. 参考


创作不易,麻烦点点赞和关注咯!

相关推荐
藦卡机器人8 分钟前
自动焊接机器人的核心技术要求与标准
人工智能·算法·机器人
小冷coding8 分钟前
AI Agent 技术栈并探索其在业务创新中的应用
人工智能
喝凉白开都长肉的大胖子12 分钟前
将gym更新到Gymnasium后需要修改哪些位置
人工智能·机器学习·强化学习’
橙露22 分钟前
时间序列分析实战:用 Python 实现股票价格预测与风险评估
人工智能·python·机器学习
啊阿狸不会拉杆25 分钟前
第 3 章 灰度变换与空间域滤波
图像处理·人工智能·机器学习·计算机视觉·数据挖掘·数字图像处理
神云瑟瑟26 分钟前
看langchain理解python中的链式调用
python·langchain·链式调用
栈与堆26 分钟前
LeetCode 21 - 合并两个有序链表
java·数据结构·python·算法·leetcode·链表·rust
CCPC不拿奖不改名32 分钟前
循环神经网络RNN:整数索引→稠密向量(嵌入层 / Embedding)详解
人工智能·python·rnn·深度学习·神经网络·自然语言处理·embedding
鹤入云霄33 分钟前
基于Python的空气质量监测系统
python
石去皿1 小时前
大模型面试常见问答
人工智能·面试·职场和发展