第一篇-ChatGLM-webui-Windows安装部署-CPU版
第二篇-二手工作站配置
第三篇-Tesla P40+CentOS-7+CUDA 11.7 部署实践
硬件环境
系统:CentOS-7
CPU: 14C28T
显卡:Tesla P40 24G
准备安装
驱动: 515
CUDA: 11.7
cuDNN: 8.9.2.26
安装依赖
yum clean all
yum update
yum install -y gcc gcc-c++ pciutils kernel-devel-$(uname -r) kernel-headers-$(uname -r)
查看GPU信息
lspci | grep -i nvidia
屏蔽 nouveau 显卡驱动
步骤一
查看是否安装了nouveau,有结果表示正在使用nouveau
lsmod | grep nouveau
步骤二
创建一个新的文件,在文件中加入下面两句代码
vim /etc/modprobe.d/blacklist-nouveau.conf
blacklist nouveau
options nouveau modeset=0
步骤三
dracut --force
步骤四 重启,
reboot
步骤五 验证是否禁用成功,没有结果表示禁用成功
lsmod | grep nouveau
-----------------------------------
重建initramfs image
备份执行
mv /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname -r).img.bak
dracut /opt/initramfs-$(uname -r).img $(uname -r)
修改运行级别为文本模式
systemctl set-default multi-user.target
重启
reboot
安装nvidia驱动
下载驱动
https://www.nvidia.cn/Download/index.aspx
Operating System: Linux 64-bit
CUDA Toolkit: 11.7
我下载的是 NVIDIA-Linux-x86_64-515.105.01.run
运行
./NVIDIA-Linux-x86_64-515.105.01.run
重启之后出现选择界面,32 选择no
验证
nvidia-smi
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 515.65.01 Driver Version: 515.65.01 CUDA Version: 11.7 |
|-------------------------------+----------------------+----------------------+
| GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. |
| | | MIG M. |
|===============================+======================+======================|
| 0 Tesla P40 Off | 00000000:03:00.0 Off | 0 |
| N/A 38C P0 49W / 250W | 0MiB / 23040MiB | 1% Default |
| | | N/A |
+-------------------------------+----------------------+----------------------+
+-----------------------------------------------------------------------------+
| Processes: |
| GPU GI CI PID Type Process name GPU Memory |
| ID ID Usage |
|=============================================================================|
| No running processes found |
+-----------------------------------------------------------------------------+
安装cuda
下载文件
https://developer.nvidia.com/cuda-toolkit-archive
页面选择
Linux x86_64 CentOS 7 rulfile(local)
执行安装配置
sh cuda_11.7.1_515.65.01_linux.run
选
accept
我只安装了 CUDA Toolkit 11.7 选择如下
│ - [ ] Driver │
│ [ ] 515.65.01 │
│ + [X] CUDA Toolkit 11.7 │
│ [ ] CUDA Demo Suite 11.7 │
│ [ ] CUDA Documentation 11.7 │
│ - [ ] Kernel Objects │
│ [ ] nvidia-fs │
│ Options
再选 install
配置环境变量
vim /etc/profile
export PATH=/usr/local/cuda/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH
source /etc/profile
验证
nvcc -V
nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2022 NVIDIA Corporation
Built on Wed_Jun__8_16:49:14_PDT_2022
Cuda compilation tools, release 11.7, V11.7.99
Build cuda_11.7.r11.7/compiler.31442593_0
安装cuDNN
下载文件
https://developer.nvidia.com/rdp/cudnn-download
cudnn-linux-x86_64-8.9.2.26_cuda11-archive.tar.xz
部署
/opt/nvidia/cudnn/
tar xvf cudnn-linux-x86_64-8.9.2.26_cuda11-archive.tar.xz
cd cudnn-linux-x86_64-8.9.2.26_cuda11-archive
cp include/cudnn.h /usr/local/cuda/include
cp lib/libcudnn* /usr/local/cuda/lib64
chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*
部署完成
参考列表
Centos7安装NVIDIA GPU显卡驱动
https://blog.csdn.net/syl321314362/article/details/128751708
CentOS7 禁用nouveau及安装显卡驱动
https://blog.51cto.com/u_14825502/6101852
Centos升级OpenSSL版本
https://www.cnblogs.com/shiningrise/p/16840969.html
参考命令
centos07-关闭防火墙
systemctl disable firewalld.service
systemctl stop firewalld
其他参考
这个高版本安装失败
只能安装430.40对应cuda-11.4(好像),这个安装简单,但是cuda版本低
yum install nvidia-detect
检测显卡
$ nvidia-detect -v
根据检测的版本安装显卡驱动程序
$ yum install nvidia-x11-drv-430.40
版本号要一致
重启,运行命令,查看状态
$ nvidia-smi