Ubuntu20.04安装CUDA、cuDNN、tensorflow2可行流程(症状:tensorflow2在RTX3090上运行卡住)

最近发现我之前在2080ti上运行好好的代码,结果在3090上运行会卡住很久,而且模型预测结果完全乱掉,于是被迫研究了一天怎么在Ubuntu20.04安装CUDA、cuDNN、tensorflow2。

1.安装CUDA(包括CUDA驱动和CUDA toolkit,注意此toolkit和通过conda或pip安装的cudatoolkit不是一个东西)

谷歌搜索"ubuntu install CUDA11.0"

打开,依次选择:

运行下面的第一句指令下载CUDA安装包:

接着运行第二个指令开始安装,等待提示,按步骤选择就行,主要是下面这一步,如果你已经安装了很高版本的CUDA Driver了的话,就没必要选他了。

接着,需要配置一下环境变量,具体就是在根目录的.bashrc中的末尾添加两行代码

具体操作:终端中输入"vim .bashrc",先输入i进入编辑模式,在末尾添加下面两行,其中具体是填写cuda-11.0还是cuda,这要看你的/usr/local里面的文件夹是cuda还是cuda-11.0,我的话因为装了好多个版本,所以有cuda、cuda-11.0、cuda-11.2等等,所以需要分清楚。添加之后,点击"Esc",输入":wq"保存并退出。

好了,CUDA就装好了,可以重启电脑后,通过ncvv -V指令看一下CUDA版本,如果最后一行显示11.0就说明装好了。

说明一下,通过ncvv -V显示的CUDA版本和nvidia-smi显示的版本会不一致,这不影响我们使用。

2.安装cuDNN

谷歌搜索cudnn archive

点击进入,选一个既满足cuDNN8.0也满足CUDA11.0的选项,点开,下载linux_x86这个

就会下载一个tgz压缩包

使用指令tar -zxvf cudnn-11.0-linux-x64-v8.0.2.39.tgz进行安装,安装完成后,会在旁边生成一个cuda文件夹,里面都是cudnn的文件。

然后,需要手动将其中一些文件复制到./usr/local/cuda-11.0里面

  1. cp cuda/lib64/* /usr/local/cuda-11.0/lib64/

  2. cp cuda/include/* /usr/local/cuda-11.0/include/

好了,cuDNN也装完了。

  1. 安装tensorflow,这个是最没技术含量的了

只需要写对版本就行,我这一套操作流程是参考了从源代码构建 | TensorFlowhttps://tensorflow.google.cn/install/source?hl=zh-cn#linux

里面"经过测试的构建配置"下"GPU"里面给出的一种已经被验证的组合:

所以,只需要pip install tensorflow==2.4.0就大功告成了。

我们运行一下

import tensorflow as tf

print(tf.version)

print('GPU', tf.test.is_gpu_available())

print("Num GPUs Available: ", len(tf.config.list_physical_devices('GPU')))

或者运行一下

python3 -c "import os; os.environ['TF_CPP_MIN_LOG_LEVEL'] = '3'; import tensorflow as tf; print('Num GPUs Available: ', len(tf.config.list_physical_devices('GPU')))"

大功告成了!

相关推荐
m0_650108242 小时前
【论文精读】CMD:迈向高效视频生成的新范式
人工智能·论文精读·视频扩散模型·高效生成·内容 - 运动分解·latent 空间
电鱼智能的电小鱼2 小时前
基于电鱼 AI 工控机的智慧工地视频智能分析方案——边缘端AI检测,实现无人值守下的实时安全预警
网络·人工智能·嵌入式硬件·算法·安全·音视频
年年测试2 小时前
AI驱动的测试:用Dify工作流实现智能缺陷分析与分类
人工智能·分类·数据挖掘
唐兴通个人3 小时前
人工智能Deepseek医药AI培训师培训讲师唐兴通讲课课程纲要
大数据·人工智能
WGS.3 小时前
llama factory 扩充词表训练
深度学习
共绩算力3 小时前
Llama 4 Maverick Scout 多模态MoE新里程碑
人工智能·llama·共绩算力
DashVector4 小时前
向量检索服务 DashVector产品计费
数据库·数据仓库·人工智能·算法·向量检索
AI纪元故事会4 小时前
【计算机视觉目标检测算法对比:R-CNN、YOLO与SSD全面解析】
人工智能·算法·目标检测·计算机视觉
音视频牛哥4 小时前
从协议规范和使用场景探讨为什么SmartMediaKit没有支持DASH
人工智能·音视频·大牛直播sdk·dash·dash还是rtmp·dash还是rtsp·dash还是hls
赞奇科技Xsuperzone5 小时前
DGX Spark 实战解析:模型选择与效率优化全指南
大数据·人工智能·gpt·spark·nvidia