[pytorch]torch.cuda用法以及判断显卡是不是存在问题

常见用法:

torch.cuda.is_available() # 查看是否有可用GPU

torch.cuda.device_count() # 查看GPU数量

torch.cuda.get_device_capability(device) # 查看指定GPU容量

torch.cuda.get_device_name(device) # 查看指定GPU名称

torch.cuda.empty_cache() # 清空程序占用的GPU资源

torch.cuda.manual_seed(seed) # 设置随机种子

torch.cuda.manual_seed_all(seed) # 设置随机种子

torch.cuda.get_device_properties(i) # i为第几张卡,显示该卡的详细信息

场景问题:我使用torch.cuda.device_count()返回1但是我用nvidia-smi显示是2个显卡,这个是为啥呢?

第一个原因:你在环境变量设置了CUDA_VISIBLE_DEVICES

第二个原因:你显卡坏了一个,如何判断是不是坏了可以使用上面接口测试

import torch

device=torch.device("cuda:0")

print(torch.cuda.get_device_capability(device))

把0改成1如果报错则表示1这个显卡有问题或者不存在,据此可以判断显卡坏了。但是这个只是系统层面表示坏了。还需要进一步判断。首先重启系统在测试一次,不行就把显卡拔插一下,依然不行则做最后尝试把系统重装一次(这个一般都没效果),还不行只能说明显卡坏了。

相关推荐
jiuri_121519 小时前
Docker使用详解:在ARM64嵌入式环境部署Python应用
python·docker·容器
chenchihwen19 小时前
AI代码开发宝库系列:Function Call
人工智能·python·1024程序员节·dashscope
FreeBuf_19 小时前
微软Copilot被用于窃取OAuth令牌,AI Agent成为攻击者帮凶
人工智能·microsoft·copilot
学slam的小范19 小时前
ROS跑ORB-SLAM3遇见的问题总结
人工智能·机器人·自动驾驶
coding消烦员19 小时前
新版 vscode 去除快捷键 Ctrl+I 显示 Copilot 的 AI 对话框
人工智能·vscode·copilot
周杰伦_Jay20 小时前
【自动驾驶开源仿真平台】Carla、AirSim、Udacity self-driving-car-sim、Apollo、Autoware。
人工智能·机器学习·自动驾驶
牛奶还是纯的好20 小时前
双目测距实战5-立体矫正
人工智能·3d
汤姆yu20 小时前
基于python的化妆品销售分析系统
开发语言·python·化妆品销售分析
无风听海20 小时前
神经网络之窗口大小对词语义向量的影响
人工智能·深度学习·神经网络