[pytorch]torch.cuda用法以及判断显卡是不是存在问题

常见用法:

torch.cuda.is_available() # 查看是否有可用GPU

torch.cuda.device_count() # 查看GPU数量

torch.cuda.get_device_capability(device) # 查看指定GPU容量

torch.cuda.get_device_name(device) # 查看指定GPU名称

torch.cuda.empty_cache() # 清空程序占用的GPU资源

torch.cuda.manual_seed(seed) # 设置随机种子

torch.cuda.manual_seed_all(seed) # 设置随机种子

torch.cuda.get_device_properties(i) # i为第几张卡,显示该卡的详细信息

场景问题:我使用torch.cuda.device_count()返回1但是我用nvidia-smi显示是2个显卡,这个是为啥呢?

第一个原因:你在环境变量设置了CUDA_VISIBLE_DEVICES

第二个原因:你显卡坏了一个,如何判断是不是坏了可以使用上面接口测试

import torch

device=torch.device("cuda:0")

print(torch.cuda.get_device_capability(device))

把0改成1如果报错则表示1这个显卡有问题或者不存在,据此可以判断显卡坏了。但是这个只是系统层面表示坏了。还需要进一步判断。首先重启系统在测试一次,不行就把显卡拔插一下,依然不行则做最后尝试把系统重装一次(这个一般都没效果),还不行只能说明显卡坏了。

相关推荐
BU摆烂会噶几秒前
【LangGraph】 流式处理入门
人工智能·python·langchain·人机交互
星辰徐哥3 分钟前
人工智能:计算机视觉的基础与应用
人工智能·计算机视觉·ai·预处理·特征提取
发哥来了5 分钟前
东莞AI培训课程横向对比:五家机构教学与就业质量评测
大数据·人工智能·机器学习·ai·aigc
AI医影跨模态组学11 分钟前
(综述)J Transl Med 浙江大学医学院附属第二医院等团队:放射组学在胶质母细胞瘤复发中的应用:预测、定位及与治疗相关效应鉴别的进展
人工智能·深度学习·医学·医学影像·影像组学
神工坊13 分钟前
新闻︱神工坊受邀出席无锡人工智能产业园“AI赋能研发设计”主题活动,共探算力与AI时代下的CAE范式革新
人工智能·ai·hpc·cfd·cae·求解加速·智能修模
计算机毕业编程指导师14 分钟前
【Python大数据项目推荐】基于Hadoop+Django脑卒中风险分析系统源码解析 毕业设计 选题推荐 毕设选题 数据分析 机器学习 数据挖掘
大数据·hadoop·python·计算机·spark·毕业设计·脑卒中
我是发哥哈17 分钟前
东莞AI培训主流方案横向评测:5大选型维度解析
大数据·人工智能·学习·机器学习·chatgpt·ai编程
千寻girling20 分钟前
机器学习 | 感知机 | 尚硅谷学习
人工智能·学习·机器学习
南河的南22 分钟前
RAG项目总结
人工智能
大模型真好玩22 分钟前
LangChain DeepAgents 速通指南(八)—— DeepAgents流式输出详解
人工智能·langchain·agent