本文主要介绍为Ubuntu安装Nvidia GPU驱动,演示的环境的硬件为AWS EC2 g4dn机型,它搭载了一颗服务器专用的T4 Tensor Core GPU,这台服务器运行Ubuntu Server 22.04 LTS。
Amazon EC2 G4dn 实例专用于加速机器学习推理和图形密集型工作负载,它搭载的T4 Tensor Core GPU有16GB的显存,非常适合中等负荷下的AI场景。本次我使用的是最经济的g4dn.xlarge
。你自己也可以组装在你的个人电脑(需要Nvidia消费级显卡)上正常复现安装流程。
安装驱动
检查环境
输入uname -a
和cat /etc/lsb-release
进行操作系统检查,我们看到正在运行的是Ubuntu Server 22.04.3 LTS(内核为专为AWS云上环境优化后的Linux 6.2)。
安装依赖项
我们先安装一些依赖项,比如gcc
,g++
,make
我们执行:sudo apt update -y && sudo apt upgrade -y && sudo apt install vim gcc g++ make python3-pip -y
查询可用的Nvidia软件版本
我们可以运行nvidia-detector
和ubuntu-drivers devices
查看可以使用的驱动版本。如果上述的2条命令找不到,可以输入sudo apt install ubuntu-drivers-common
进行安装。
然后使用sudo apt install nvidia-driver-535 -y
安装最新的535版本驱动(你可以安装nvidia-driver-535-server
版本)
安装完成后需要重启服务器,我们直接sudo reboot
就好
检测驱动安装
重启后,我们运行nvidia-smi
和cat /proc/driver/nvidia/version
进行检查。我们可以看到535版本的驱动安装好了