Ubuntu 下配置 NVIDIA 驱动与 CUDA 环境(适配 RTX 4060Ti)

本文记录了在 Ubuntu 20.04 系统中,从零开始为 NVIDIA GeForce RTX 4060Ti 配置 GPU 驱动与 CUDA Toolkit 的完整过程,适合有一定终端基础的开发者参考。

💡 配置逻辑

在 Ubuntu 系统中配置 CUDA 环境时,必须先安装 NVIDIA 驱动,再安装 CUDA Toolkit,两者缺一不可且顺序不能颠倒 。NVIDIA 驱动是操作系统与显卡之间的桥梁,只有驱动正确安装并加载后,系统才能识别显卡,nvidia-smi 才能正常显示 GPU 信息。而 CUDA Toolkit 则是在驱动的基础上提供 GPU 加速计算的开发工具包,包括编译器(nvcc)、库函数等。如果驱动未正确安装,即使安装了 CUDA,也无法发挥 GPU 加速的作用。两者的关系是:CUDA 依赖驱动运行,驱动是基础,CUDA 是工具,先驱动后 CUDA,是配置流程的核心逻辑。


📌 系统环境

  • 操作系统:Ubuntu 20.04(适用于 22.04 及其他版本)

  • 显卡型号:NVIDIA GeForce RTX 4060 Ti(移动版)

  • 配置目标:

    • 正确安装 NVIDIA 驱动

    • 安装并验证 CUDA Toolkit(推荐 12.x)

    • 确保 nvidia-sminvcc -V 均可正常使用


🛠️ 安装流程概览

  1. 更新系统与内核(可选)

  2. 安装 NVIDIA 官方驱动

  3. 关闭 Secure Boot(如有必要)

  4. 安装 CUDA Toolkit(推荐从官网安装

  5. 验证安装是否成功


✅ 步骤一:更新系统与内核

打开终端,依次执行以下命令:

复制代码
sudo apt update
sudo apt upgrade -y
sudo reboot  # 重启以加载更新后的内核(如有)

✅ 步骤二:安装推荐的 NVIDIA 驱动

Step1. 检查 Ubuntu 推荐的驱动版本:
bash 复制代码
ubuntu-drivers devices
Step 2. 安装推荐的驱动(显示 "recommended" 字样):
bash 复制代码
sudo apt install nvidia-driver-570-open
Step 3. 安装完成后重启系统:
复制代码
sudo reboot
Step 4. 验证 NVIDIA 驱动是否安装成功
复制代码
nvidia-smi

如果输出 GPU 信息、驱动版本、CUDA 版本等,说明驱动安装成功。

❌ 错误情况:如果出现以下错误

复制代码
NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver.

请继续以下排查步骤👇


🧰 故障排查:nvidia-smi 无法运行

1️⃣ 检查驱动是否真的安装:

bash 复制代码
dpkg -l | grep nvidia-driver

若无输出,说明驱动未成功安装。


2️⃣ 检查内核模块是否加载:

bash 复制代码
lsmod | grep nvidia

无输出 → 模块未加载,尝试手动加载:

bash 复制代码
sudo modprobe nvidia

如果出现错误:

复制代码
modprobe: ERROR: could not insert 'nvidia': Operation not permitted

可能是因为 BIOS/UEFI 启用了 Secure Boot


3️⃣ 检查 Secure Boot 状态:

复制代码
mokutil --sb-state

4️⃣ 再次尝试加载驱动并查看状态:

复制代码
sudo modprobe nvidia
nvidia-smi

🎉 如果一切正常,将看到如下信息:

  • GPU 型号(RTX 4060Ti)

  • 驱动版本(如 545.29.06)

  • 支持的 CUDA 最高版本(12.3)

  • 显存占用情况


✅ 步骤三:安装 CUDA Toolkit(推荐不要使用 apt 默认源

⚠️你曾尝试:

复制代码
sudo apt install nvidia-cuda-toolkit

⚠️ 但它安装的是 CUDA 10.1(过时版本,2019 年)

复制代码
nvcc --version
# 输出:
# Cuda compilation tools, release 10.1, V10.1.243

💡 正确做法:前往 NVIDIA 官网下载安装最新版

  1. 打开官网:CUDA Toolkit 12.9 Update 1 Downloads | NVIDIA Developer

  2. 参考链接:【CUDA】Ubuntu系统如何安装CUDA保姆级教程(2022年最新)_ubuntu安装cuda-CSDN博客

  3. 选择你的平台,例如:

    • Operating System: Linux

    • Architecture: x86_64

    • Distribution: Ubuntu

    • Version: 20.04

    • Installer Type: deb (local) 推荐

    • CUDA Version: 12.3 或 12.4(推荐)

  4. 按照生成的命令依次执行,例如:

    复制代码
    sudo dpkg -i cuda-repo-ubuntu2004-12-3-local_12.3.0-1_amd64.deb
    sudo cp /var/cuda-repo-ubuntu2004-12-3-local/cuda-*-keyring.gpg /usr/share/keyrings/
    sudo apt-get update
    sudo apt-get -y install cuda

✅ 步骤四:配置环境变量

编辑 .bashrc.zshrc

复制代码
nano ~/.bashrc

添加以下内容(假设安装在 /usr/local/cuda):

复制代码
export PATH=/usr/local/cuda/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH

保存后执行:

复制代码
source ~/.bashrc

✅ 步骤五:验证 CUDA 安装是否成功

复制代码
nvcc --version

期望输出:

复制代码
Cuda compilation tools, release 12.3, V12.3.xxx

✅ 附加验证(可选)

测试 CUDA 示例程序:

复制代码
cd /usr/local/cuda/samples/1_Utilities/deviceQuery
sudo make
./deviceQuery

输出信息中如出现:

复制代码
Result = PASS

表示 CUDA 可正常运行。


✅ 总结

步骤 是否完成 说明
驱动安装 使用 ubuntu-drivers 推荐版本
Secure Boot 禁用 否则 nvidia-smi 报错
CUDA 安装 推荐安装 CUDA 12.3 官方包
环境变量配置 添加 PATH 和 LD_LIBRARY_PATH
nvidia-smi 正常 GPU 驱动运行正常
nvcc --version 正常 CUDA 编译器可用
相关推荐
Doris_LMS4 小时前
在Linux下安装nginx(保姆级别)
linux·运维·nginx·centos
超級二蓋茨5 小时前
在 CentOS 上安装 FFmpeg
linux·ffmpeg·centos
obboda7 小时前
Linux基础复习:字符输入与输出
linux·运维·服务器
*wj7 小时前
【linux驱动开发】Vscode + Remote SSH + clangd + bear=内核源码阅读环境搭建
linux·驱动开发·vscode
FED_AF9 小时前
Linux救援模式之应用篇
linux·运维
拾心219 小时前
【运维基础】Linux 进程调度管理
linux·运维·服务器
橘颂TA10 小时前
【Linux】的起源 and 3秒学习11个基本指令
linux·指令·linux的历史
~狂想家~11 小时前
Ubuntu20.04安装和配置Samba实现Win11下共享文件夹
linux·ubuntu·samba
ansondroider11 小时前
Ubuntu 抽取系统制作便于chroot的镜像文件
linux·ubuntu·chroot
羚羊角uou11 小时前
【Linux】编辑器vim和编译器gcc/g++
linux·运维·编辑器