机器学习&&深度学习——非NVIDIA显卡怎么做深度学习(坑点排查)

👨‍🎓作者简介:一位即将上大四,正专攻机器学习的保研er

🌌上期文章:机器学习&&深度学习------数值稳定性和模型化参数(详细数学推导)

📚订阅专栏:机器学习&&深度学习

希望文章对你们有所帮助

这一部分掉坑真的不知道掉了多少个。我是AMD卡的,我想AMD卡的同志们很多都掉过坑了,也许就在我掉过众多坑里面。网上很多说法是AMD卡做深度学习可以使用RCom,然而我发现几乎没有太多资料,毕竟做深度学习的大多数用的是N卡。emmmm,万一掉坑了都没有人能启发到我,所以当时我就放弃了,接下来给出坑点并且排查,最终给出绝对可行的解决方案。

AMD显卡怎么做深度学习

之前的内容中,我都是使用了CPU版本的torch来进行深度学习,在前面的线性模型当然很好跑,因为线性模式确实是比较简单的。但是随着之后的模型越发的复杂,我们很需要GPU来帮助我们实现并行运算,因此我们需要安装GPU版本的torch。

卸载CPU版本的torch

因为听说有了GPU版本的torch,在一些使用的过程中可能会出现冲突,所以我第一下想到的就是卸载CPU版本的torch。卸载的时候还需要把这个torch中所包含的包也一并卸载了。

卸载方式

使用cmd终端卸载,卸载的方式有两种:

1、pip方式卸载:

bash 复制代码
pip uninstall torch
pip uninstall torchvision

2、conda方式卸载:

bash 复制代码
conda uninstall pytorch
conda uninstall libtorch

据说是使用了conda方式下载的话就用第二种,pip方式下载的话就用第一种,感觉好像又不是很有道理,总之两个都试过了,也都告诉我卸载成功了。

问题

但是接下来就出现了很奇怪的一幕。我在cmd终端输入如下语句:

python 复制代码
python

import torch

torch.__version__

最终告诉我的答案里面是不存在torch,那理论上应该是成功了才对。。。然而我去pycharm中执行:

python 复制代码
import torch

print(torch.__version__)

额。。。居然给我输出了CPU版本的torch,我还猜测是不是亲爱的pycharm没缓过来。。。无论重启还是关机都显示含有CPU版本的torch。。。原地捣鼓半天,网上好像也没个针对这个具体问题的解决方案,最终放弃卸载。

安装GPU版本的torch

安装方式

进入pytorch官网:
pytorch官网

用上面的conda或者pip语句都是可以的,在终端中运行就好,连cuda版本都给咱们指定好了。

问题

我以为pycharm是出了什么毛病,明明终端显示没有CPU版本的torch了,偏偏pycharm输出了。。。我就以为换个GPU版本的torch应该就没事了,这其实也是瞎捣鼓,最终在pycharm中输出CPU版本的torch,在终端输出GPU版本的torch。

因此在pycharm中跑GPU方式的代码是行不通的。。。

Anaconda配置虚拟环境

既然卸载的方式行不通,我就找别的方法,之前已经安装过了Anaconda,我们靠着这个工具来实现环境的配置。步骤如下:

1、我们可以自行创建虚拟环境:

python 复制代码
conda create --name pytorch python=3.9

我们可以通过

python 复制代码
conda env list

来查看当前的环境,其中base是本来的环境,pytorch是我们创建的虚拟环境。

2、我们需要激活这个环境,那么接下来下载的东西(包括各种的包、包括GPU版本的torch)都可以下载到这个虚拟环境去,也就是说这个虚拟环境本来就是干净的,不像base环境那样装过CPU版本的torch。

激活的语句为:

python 复制代码
avtivate pytorch

再打开当前的环境列表,可以看出pytorch已经被激活:

3、下载GPU版本的torch

将上面的语句进行下载,接下来就可以把torch下载到自己新建的虚拟环境pytorch中去了。

4、在pycharm中配置它。

打开File-Settings-Project:Python-Python Interpreter:

点开Add Local Interpreter,即可选择之前的路径成功切换。

但是此时我还是不能运行相关语句,搜相关资料以后知道是没有cuda,运行语句:

python 复制代码
print(torch.cuda.is_available())

最后会返回False,因此我们需要下载cuda。

下载cuda

这个步骤就不细说了,这个下载过程是傻瓜式教程,网上有。

问题

这个问题就比较严重了。。。安装都安装不成,安装了我才知道只有NVIDIA卡是可以下载cuda的,那我的方向再一次断了,而且我很难在原有基础上转变思路。

最终解决方案

接下来就是我最终的解决方案了,租借线上平台。

我是用的autodl平台去租借的,大家可以放心使用(我觉得官网有点话都写的不太清楚,我一直不知道到底只是租一个GPU而已还是啥,因为如果只是租一个GPU我没有cuda照样不行,最终还是搞了点钱去试了一下),点开以后里面有使用文档,使用方法很容易,大家可以放心使用。

相关推荐
z_mazin42 分钟前
反爬虫机制中的验证码识别:类型、技术难点与应对策略
人工智能·计算机视觉·目标跟踪
lixy5791 小时前
深度学习3.7 softmax回归的简洁实现
人工智能·深度学习·回归
youhebuke2252 小时前
利用deepseek快速生成甘特图
人工智能·甘特图·deepseek
訾博ZiBo2 小时前
AI日报 - 2025年04月26日
人工智能
郭不耐2 小时前
DeepSeek智能时空数据分析(三):专业级地理数据可视化赏析-《杭州市国土空间总体规划(2021-2035年)》
人工智能·信息可视化·数据分析·毕业设计·数据可视化·城市规划
AI军哥2 小时前
MySQL8的安装方法
人工智能·mysql·yolo·机器学习·deepseek
余弦的倒数2 小时前
知识蒸馏和迁移学习的区别
人工智能·机器学习·迁移学习
Allen Bright2 小时前
【机器学习-线性回归-2】理解线性回归中的连续值与离散值
人工智能·机器学习·线性回归
weixin_贾2 小时前
最新AI-Python机器学习与深度学习技术在植被参数反演中的核心技术应用
python·机器学习·植被参数·遥感反演
青松@FasterAI3 小时前
【程序员 NLP 入门】词嵌入 - 上下文中的窗口大小是什么意思? (★小白必会版★)
人工智能·自然语言处理