ubuntu 20.04下 Tesla P100加速卡使用

1.系统环境:系统ubuntu 20.04, python 3.8

2.查看cuDNN/CUDA与tensorflow的版本关系如下:

Build from source | TensorFlow

从上图可以看出,python3.8 对应的tensorflow/cuDNN/CUDA版本。

3.安装tensorflow

#pip3 install tensorflow

新版本tensorflow不用额外指定tensorflow gpu版本,默认安装的是tensorflow 2.13版本

4.安装Tesla P100 driver

Ubuntu 下执行 $ubuntu-drivers devices

可以看到系统支持的P100 driver情况,这里安装推荐的nvidia-driver-535

$sudo apt install nvidia-driver-535

安装完成后可以使用$nvidai-smi命令查看到显卡设备,注意,需要打开BIOS above 4G功能,否则无法找到显卡。

5.安装CUDA

https://developer.nvidia.com/cuda-toolkit-archive 下载cuda 11.8

按照下面方法卸载vnidia-drm 内核module,否则CUDA安装时会提示 nvidia 组件被占用:

sudo systemctl isolate multi-user.target // 可以看到nvidia-drm 内核module被挂载 lsmod | grep vnidia-drm

卸载该module

$sudo modprobe -r nvidia-drm

然后执行CUDA安装文件,因为前面已经安装过了driver,这里去掉选择Driver(尝试过不安装前面的driver而在CUDA安装时再安装driver,会提示driver安装失败)。然后直接选择install

添加环境变量到~/.bashrc

export PATH=/usr/local/cuda-11.8/bin{PATH:+:{PATH}}

export LD_LIBRARY_PATH=/usr/local/cuda/lib64:/usr/local/cuda-11.8/lib64:/usr/local/cuda/extras/CUPTI/lib64:$LD_LIBRARY_PATH

export CUDA_HOME=/usr/local/cuda

7.安装cuDNN

CUDA Deep Neural Network (cuDNN) | NVIDIA Developer 下载cuDNN 8.6,下载完后解压,拷贝相应文件到CUDA目录:

$ sudo cp include/* /usr/local/cuda/include

$ sudo cp cuda/lib64/* /usr/local/cuda/lib64

8.解决tensorflow "could not load library libcublasLt.so.10"、"could not load library libcublas.so.10"问题

运行tensorflow时提示上面的问题,解决方法: 进入目录:/usr/local/cuda/targets/x86_64-linux/lib,建立两个链接文件

$ln -s libcublasLt.so.11 libcublasLt.so.10

$ln -s libcublas.so.11 libcublas.so.10

使用tensorflow查看显卡是否安装正常

$import tensorflow as tf

$tf.config.list_physical_devices('GPU')

参考:

Linux系统下安装TensorFlow的GPU版本 | AI柠檬

相关推荐
QQ676580086 小时前
基于 TensorFlow 2 的 WGAN来生成表格数据、数值数据和序列数据。 WGAN生成对抗网络。代码仅供参考
生成对抗网络·tensorflow·neo4j·表格数据·wgan·对抗网络·序列数据
八戒社2 天前
如何使用插件和子主题添加WordPress自定义CSS(附:常见错误)
前端·css·tensorflow·wordpress
CC_IsMe4 天前
Linux服务器 TensorFlow找不到GPU
linux·jupyter·ssh·conda·tensorflow
雾迟sec5 天前
TensorFlow 的基本概念和使用场景
人工智能·python·tensorflow
盼小辉丶7 天前
TensorFlow深度学习实战(18)——K-means 聚类详解
深度学习·tensorflow·kmeans
halfpast38 天前
Ubuntu20.04 gr-gsm完整安装教程
ubuntu20.04·gsm·gr-gsm·gnuradio
之之为知知8 天前
深度学习能取代机器学习吗?
人工智能·pytorch·python·深度学习·机器学习·数据挖掘·tensorflow
kovlistudio8 天前
大模型应用开发第五讲:成熟度模型:从ChatGPT(L2)到未来自主Agent(L4)
人工智能·深度学习·学习·机器学习·chatgpt·tensorflow
kovlistudio9 天前
大模型应用开发第二讲:核心能力:自主性、适应性、推理能力
人工智能·深度学习·机器学习·大模型·tensorflow
郜太素9 天前
自然语言处理入门及文本预处理
人工智能·自然语言处理·nlp·tensorflow·word2vec