[pytorch]torch.cuda用法以及判断显卡是不是存在问题

常见用法:

torch.cuda.is_available() # 查看是否有可用GPU

torch.cuda.device_count() # 查看GPU数量

torch.cuda.get_device_capability(device) # 查看指定GPU容量

torch.cuda.get_device_name(device) # 查看指定GPU名称

torch.cuda.empty_cache() # 清空程序占用的GPU资源

torch.cuda.manual_seed(seed) # 设置随机种子

torch.cuda.manual_seed_all(seed) # 设置随机种子

torch.cuda.get_device_properties(i) # i为第几张卡,显示该卡的详细信息

场景问题:我使用torch.cuda.device_count()返回1但是我用nvidia-smi显示是2个显卡,这个是为啥呢?

第一个原因:你在环境变量设置了CUDA_VISIBLE_DEVICES

第二个原因:你显卡坏了一个,如何判断是不是坏了可以使用上面接口测试

import torch

device=torch.device("cuda:0")

print(torch.cuda.get_device_capability(device))

把0改成1如果报错则表示1这个显卡有问题或者不存在,据此可以判断显卡坏了。但是这个只是系统层面表示坏了。还需要进一步判断。首先重启系统在测试一次,不行就把显卡拔插一下,依然不行则做最后尝试把系统重装一次(这个一般都没效果),还不行只能说明显卡坏了。

相关推荐
AI科技星几秒前
全域数学·数术本源·第四卷《分析原本》【乖乖数学】
人工智能·机器学习·数学建模·数据挖掘·agi
WL_Aurora几秒前
Python 算法基础篇之堆和优先队列
python·算法
早日退休!!!1 分钟前
PyTorch适配NPU
人工智能·pytorch·python
qcx234 分钟前
【AI Agent通识九课】01 · Agent 和 ChatGPT 到底差在哪?
人工智能·ai·chatgpt·agent
盼小辉丶7 分钟前
PyTorch强化学习实战——构建生成对抗网络生成Atari游戏画面
pytorch·游戏·生成对抗网络
刀法如飞10 分钟前
一款开箱即用的Flask 3.0 MVC工程脚手架,面向AI开发
后端·python·flask
小手智联老徐11 分钟前
Claude Code CLI + DeepSeek V4:终结 AI 编程高成本时代的王炸组合
人工智能
2zcode14 分钟前
基于深度学习的糖尿病眼底图像分类识别系统(含UI界面+多模型对比+数据集+训练代码)
人工智能·深度学习·分类
xingpanvip14 分钟前
星盘接口开发文档:组合三限盘接口指南
android·开发语言·前端·python·php·lua
绛橘色的日落(。・∀・)ノ15 分钟前
机器学习 梯度下降
人工智能·机器学习