在 Ubuntu 服务器上部署 GPU 相关应用(如 AI 计算、深度学习框架)时,NVIDIA 显卡驱动的正确安装是基础。本文整理了从硬件检查到驱动自动化安装的完整流程,操作简单且适配性强,适合各类 NVIDIA 显卡(如 RTX 2060/3050/3060/40 系列)。
一、前置准备:硬件与系统检查
1. 确认显卡型号
首先通过命令验证服务器是否识别 NVIDIA 显卡,确保硬件正常被系统检测:
bash
lspci | grep -i nvidia
输出示例(以 RTX 2060 Mobile 为例):
01:00.0 VGA compatible controller: NVIDIA Corporation TU106M [GeForce RTX 2060 Mobile] (rev a1)
2. 查看系统推荐驱动
Ubuntu 内置 ubuntu-drivers 工具,可自动识别适配的显卡驱动版本,避免手动选择出错:
bash
ubuntu-drivers devices
输出会列出所有兼容驱动,标注 recommended 的为系统最优适配版本(如 nvidia-driver-580-open)。
二、自动化安装 NVIDIA 显卡驱动
1. 系统更新(避免依赖冲突)
安装驱动前先更新系统包列表和依赖,减少安装失败概率:
bash
sudo apt update && sudo apt upgrade -y
2. 自动化安装推荐驱动
无需手动下载驱动文件,系统会自动匹配并安装推荐版本,全程无需干预:
bash
sudo ubuntu-drivers autoinstall
3. 重启系统生效
驱动安装后需重启系统,才能加载 NVIDIA 内核模块:
bash
sudo reboot
三、驱动安装验证方法
驱动安装完成后,可通过以下 3 种方式验证是否生效,确保后续 GPU 应用正常运行:
1. 核心验证:nvidia-smi 命令(最常用)
这是最直接的验证方式,执行后会显示显卡核心信息:
bash
nvidia-smi
成功标志 :输出包含显卡型号、驱动版本(如 580.95.05)、CUDA 版本(如 13.0),以及 GPU 温度、显存占用等状态信息。
2. 内核模块验证:检查驱动加载状态
确认 NVIDIA 驱动内核模块已正常加载:
bash
lsmod | grep nvidia
成功标志 :输出包含 nvidia、nvidia_uvm、nvidia_drm 等模块名称,说明内核已识别驱动。
3. 版本信息验证:查看驱动版本细节
通过系统命令确认安装的驱动版本与推荐版本一致:
bash
dpkg -l | grep nvidia-driver
成功标志 :输出中显示的驱动版本(如 nvidia-driver-580)与 ubuntu-drivers devices 推荐的版本一致。