PyTorch 不支持旧GPU的异常状态与解决方案:CUDNN_STATUS_NOT_SUPPORTED_ARCH_MISMATCH

问题

d:\anaconda3\envs***\lib\site-packages\torch\cuda_init _.py:262: UserWarning:
Found GPU0 GeForce GT 710 which is of cuda capability 3.5.
PyTorch no longer supports this GPU because it is too old.
The minimum cuda capability supported by this library is 3.7.

warnings.warn(

RuntimeError Traceback (most recent call last)

Cell In3, line 906

(...)

--> 906 model = RnnNet().to(device)

907 # model = ResNet().to(device)

908 # model = SelfAttentionNet().to(device)

909 # model = TransformerNet().to(device)

(...)

RuntimeError: cuDNN error: CUDNN_STATUS_NOT_SUPPORTED_ARCH_MISMATCH
Output is truncated. View as a scrollable element or open in a text editor. Adjust cell output settings...

解决方案

你遇到的错误说明你的 GPU(NVIDIA GeForce GT 710, CUDA 3.5过旧不再被 PyTorch 支持。下面是详细解释与解决方案:


❌ 报错核心含义

text 复制代码
UserWarning:
Found GPU0 GeForce GT 710 which is of cuda capability 3.5.
PyTorch no longer supports this GPU because it is too old.
The minimum cuda capability supported by this library is 3.7.

并最终导致:

text 复制代码
RuntimeError: cuDNN error: CUDNN_STATUS_NOT_SUPPORTED_ARCH_MISMATCH

✅ 解决方案(推荐方案)

方法一:强制使用 CPU

因为你的 GPU 不再被支持,所以最直接的办法是切换到 CPU 运算,代码中这样写:

python 复制代码
device = torch.device("cpu")  # 强制使用 CPU

model = RnnNet().to(device)

并确保 所有张量也使用 CPU,例如:

python 复制代码
x = x.to(device)
y = y.to(device)

方法二:升级 GPU(如考虑 10 系列以上)

  • 推荐 CUDA Compute Capability ≥ 3.7 的 GPU,比如:
    • GTX 1050 / 1060 / 1660
    • RTX 系列
    • 或笔记本中的 MX450、RTX 2050 等
  • 当前你的 GT 710(CC 3.5)已停止支持,不能再用于当前 PyTorch 版本中的 GPU 运算。

方法三(不推荐):安装旧版 PyTorch

可尝试安装支持 CUDA 3.5 的旧版本 PyTorch,例如:

bash 复制代码
pip install torch==1.7.1+cu101 -f https://download.pytorch.org/whl/torch_stable.html

⚠️ 不推荐:旧版本可能兼容问题多、安全性差。


✅ 建议的代码示例(改为 CPU 模式)

python 复制代码
device = torch.device("cpu")

model = RnnNet().to(device)

# 推理/训练时,张量也应在 CPU 上
for batch_x, batch_y in train_loader:
    batch_x, batch_y = batch_x.to(device), batch_y.to(device)
    output = model(batch_x)

相关推荐
Kyrie6781 小时前
SkillOpt:把 Agent 的技能文件当作可训练参数
人工智能
冬奇Lab1 小时前
Workflow 系列(07):工程化与版本管理——Workflow 的 CI/CD
人工智能·工作流引擎
两万五千个小时1 小时前
Claude Code 上下文管理(一):为什么 Agent 会"失忆"?
人工智能·架构·开源
两万五千个小时1 小时前
Claude Code 上下文管理(二):零 Token 消耗的压缩三板斧
人工智能·程序员·开源
冬奇Lab1 小时前
每日一个开源项目(第150篇):caveman - 为什么用很多 token,少 token 也行——给 AI Agent 装上穴居人嘴巴
人工智能·开源·资讯
贵慜_Derek1 小时前
MAI-04|干净数据在工程上意味着什么:MAI 预训练数据治理
人工智能·算法·llm
feelmylife591 小时前
Agent 记忆设计架构 — 分层记忆:什么时候该记住,什么时候该忘记
人工智能
阿黎梨梨2 小时前
揭秘大语言模型的底层逻辑:从文本分词到高维向量的计算之旅
javascript·人工智能
moMo2 小时前
AI工程化 03:给模型喂上下文
人工智能