第三篇-Tesla P40+CentOS-7+CUDA 11.7 部署实践

第一篇-ChatGLM-webui-Windows安装部署-CPU版
第二篇-二手工作站配置
第三篇-Tesla P40+CentOS-7+CUDA 11.7 部署实践

硬件环境

系统:CentOS-7

CPU: 14C28T

显卡:Tesla P40 24G

准备安装

驱动: 515

CUDA: 11.7

cuDNN: 8.9.2.26

安装依赖

复制代码
yum clean all
yum update
yum install -y gcc gcc-c++ pciutils kernel-devel-$(uname -r) kernel-headers-$(uname -r)

查看GPU信息

复制代码
lspci | grep -i nvidia

屏蔽 nouveau 显卡驱动

步骤一

查看是否安装了nouveau,有结果表示正在使用nouveau

复制代码
lsmod | grep nouveau

步骤二

创建一个新的文件,在文件中加入下面两句代码

复制代码
  vim /etc/modprobe.d/blacklist-nouveau.conf
    blacklist nouveau
    options nouveau modeset=0

步骤三

复制代码
  dracut --force

步骤四 重启,

复制代码
  reboot

步骤五 验证是否禁用成功,没有结果表示禁用成功

复制代码
  lsmod | grep nouveau  
  -----------------------------------

重建initramfs image

备份执行

复制代码
  mv /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname -r).img.bak 
  dracut /opt/initramfs-$(uname -r).img $(uname -r)

修改运行级别为文本模式

复制代码
    systemctl set-default multi-user.target

重启

复制代码
    reboot

安装nvidia驱动

下载驱动

复制代码
  https://www.nvidia.cn/Download/index.aspx
  Operating System:	Linux 64-bit
  CUDA Toolkit:	11.7
  我下载的是  NVIDIA-Linux-x86_64-515.105.01.run

运行

复制代码
  ./NVIDIA-Linux-x86_64-515.105.01.run

重启之后出现选择界面,32 选择no

验证

复制代码
  nvidia-smi

+-----------------------------------------------------------------------------+
| NVIDIA-SMI 515.65.01    Driver Version: 515.65.01    CUDA Version: 11.7     |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|                               |                      |               MIG M. |
|===============================+======================+======================|
|   0  Tesla P40           Off  | 00000000:03:00.0 Off |                    0 |
| N/A   38C    P0    49W / 250W |      0MiB / 23040MiB |      1%      Default |
|                               |                      |                  N/A |
+-------------------------------+----------------------+----------------------+
                                                                               
+-----------------------------------------------------------------------------+
| Processes:                                                                  |
|  GPU   GI   CI        PID   Type   Process name                  GPU Memory |
|        ID   ID                                                   Usage      |
|=============================================================================|
|  No running processes found                                                 |
+-----------------------------------------------------------------------------+

安装cuda

下载文件

https://developer.nvidia.com/cuda-toolkit-archive

页面选择

Linux x86_64 CentOS 7 rulfile(local)

执行安装配置

复制代码
  sh cuda_11.7.1_515.65.01_linux.run
  选
  accept

我只安装了 CUDA Toolkit 11.7 选择如下

│ - [ ] Driver │

│ [ ] 515.65.01 │

│ + [X] CUDA Toolkit 11.7 │

│ [ ] CUDA Demo Suite 11.7 │

│ [ ] CUDA Documentation 11.7 │

│ - [ ] Kernel Objects │

│ [ ] nvidia-fs │

│ Options

再选 install

配置环境变量

复制代码
  vim /etc/profile

  export PATH=/usr/local/cuda/bin:$PATH
  export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH
    
  source /etc/profile

验证

复制代码
  nvcc -V 

nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2022 NVIDIA Corporation
Built on Wed_Jun__8_16:49:14_PDT_2022
Cuda compilation tools, release 11.7, V11.7.99
Build cuda_11.7.r11.7/compiler.31442593_0

安装cuDNN

下载文件

复制代码
  https://developer.nvidia.com/rdp/cudnn-download
  cudnn-linux-x86_64-8.9.2.26_cuda11-archive.tar.xz

部署

复制代码
  /opt/nvidia/cudnn/
  tar xvf cudnn-linux-x86_64-8.9.2.26_cuda11-archive.tar.xz

  cd cudnn-linux-x86_64-8.9.2.26_cuda11-archive

  cp include/cudnn.h /usr/local/cuda/include
  cp lib/libcudnn* /usr/local/cuda/lib64

  chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*

部署完成

参考列表

Centos7安装NVIDIA GPU显卡驱动

https://blog.csdn.net/syl321314362/article/details/128751708

CentOS7 禁用nouveau及安装显卡驱动

https://blog.51cto.com/u_14825502/6101852

Centos升级OpenSSL版本

https://www.cnblogs.com/shiningrise/p/16840969.html

参考命令

centos07-关闭防火墙

复制代码
  systemctl disable firewalld.service
  systemctl stop firewalld

其他参考

这个高版本安装失败

只能安装430.40对应cuda-11.4(好像),这个安装简单,但是cuda版本低

复制代码
yum install nvidia-detect
检测显卡
$ nvidia-detect -v
根据检测的版本安装显卡驱动程序
$ yum install nvidia-x11-drv-430.40
版本号要一致

重启,运行命令,查看状态
$ nvidia-smi
相关推荐
绵绵细雨中的乡音15 分钟前
网络基础知识
linux·网络
Peter·Pan爱编程35 分钟前
Docker在Linux中安装与使用教程
linux·docker·eureka
kunge20131 小时前
Ubuntu22.04 安装virtualbox7.1
linux·virtualbox
清溪5491 小时前
DVWA中级
linux
Sadsvit2 小时前
源码编译安装LAMP架构并部署WordPress(CentOS 7)
linux·运维·服务器·架构·centos
xiaok2 小时前
为什么 lsof 显示多个 nginx 都在 “使用 443”?
linux
苦学编程的谢3 小时前
Linux
linux·运维·服务器
G_H_S_3_3 小时前
【网络运维】Linux 文本处理利器:sed 命令
linux·运维·网络·操作文本
Linux运维技术栈3 小时前
多系统 Node.js 环境自动化部署脚本:从 Ubuntu 到 CentOS,再到版本自由定制
linux·ubuntu·centos·node.js·自动化
拾心214 小时前
【运维进阶】Linux 正则表达式
linux·运维·正则表达式