Ubuntu 下配置 NVIDIA 驱动与 CUDA 环境(适配 RTX 4060Ti)

本文记录了在 Ubuntu 20.04 系统中,从零开始为 NVIDIA GeForce RTX 4060Ti 配置 GPU 驱动与 CUDA Toolkit 的完整过程,适合有一定终端基础的开发者参考。

💡 配置逻辑

在 Ubuntu 系统中配置 CUDA 环境时,必须先安装 NVIDIA 驱动,再安装 CUDA Toolkit,两者缺一不可且顺序不能颠倒 。NVIDIA 驱动是操作系统与显卡之间的桥梁,只有驱动正确安装并加载后,系统才能识别显卡,nvidia-smi 才能正常显示 GPU 信息。而 CUDA Toolkit 则是在驱动的基础上提供 GPU 加速计算的开发工具包,包括编译器(nvcc)、库函数等。如果驱动未正确安装,即使安装了 CUDA,也无法发挥 GPU 加速的作用。两者的关系是:CUDA 依赖驱动运行,驱动是基础,CUDA 是工具,先驱动后 CUDA,是配置流程的核心逻辑。


📌 系统环境

  • 操作系统:Ubuntu 20.04(适用于 22.04 及其他版本)

  • 显卡型号:NVIDIA GeForce RTX 4060 Ti(移动版)

  • 配置目标:

    • 正确安装 NVIDIA 驱动

    • 安装并验证 CUDA Toolkit(推荐 12.x)

    • 确保 nvidia-sminvcc -V 均可正常使用


🛠️ 安装流程概览

  1. 更新系统与内核(可选)

  2. 安装 NVIDIA 官方驱动

  3. 关闭 Secure Boot(如有必要)

  4. 安装 CUDA Toolkit(推荐从官网安装

  5. 验证安装是否成功


✅ 步骤一:更新系统与内核

打开终端,依次执行以下命令:

复制代码
sudo apt update
sudo apt upgrade -y
sudo reboot  # 重启以加载更新后的内核(如有)

✅ 步骤二:安装推荐的 NVIDIA 驱动

Step1. 检查 Ubuntu 推荐的驱动版本:
bash 复制代码
ubuntu-drivers devices
Step 2. 安装推荐的驱动(显示 "recommended" 字样):
bash 复制代码
sudo apt install nvidia-driver-570-open
Step 3. 安装完成后重启系统:
复制代码
sudo reboot
Step 4. 验证 NVIDIA 驱动是否安装成功
复制代码
nvidia-smi

如果输出 GPU 信息、驱动版本、CUDA 版本等,说明驱动安装成功。

❌ 错误情况:如果出现以下错误

复制代码
NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver.

请继续以下排查步骤👇


🧰 故障排查:nvidia-smi 无法运行

1️⃣ 检查驱动是否真的安装:

bash 复制代码
dpkg -l | grep nvidia-driver

若无输出,说明驱动未成功安装。


2️⃣ 检查内核模块是否加载:

bash 复制代码
lsmod | grep nvidia

无输出 → 模块未加载,尝试手动加载:

bash 复制代码
sudo modprobe nvidia

如果出现错误:

复制代码
modprobe: ERROR: could not insert 'nvidia': Operation not permitted

可能是因为 BIOS/UEFI 启用了 Secure Boot


3️⃣ 检查 Secure Boot 状态:

复制代码
mokutil --sb-state

4️⃣ 再次尝试加载驱动并查看状态:

复制代码
sudo modprobe nvidia
nvidia-smi

🎉 如果一切正常,将看到如下信息:

  • GPU 型号(RTX 4060Ti)

  • 驱动版本(如 545.29.06)

  • 支持的 CUDA 最高版本(12.3)

  • 显存占用情况


✅ 步骤三:安装 CUDA Toolkit(推荐不要使用 apt 默认源

⚠️你曾尝试:

复制代码
sudo apt install nvidia-cuda-toolkit

⚠️ 但它安装的是 CUDA 10.1(过时版本,2019 年)

复制代码
nvcc --version
# 输出:
# Cuda compilation tools, release 10.1, V10.1.243

💡 正确做法:前往 NVIDIA 官网下载安装最新版

  1. 打开官网:CUDA Toolkit 12.9 Update 1 Downloads | NVIDIA Developer

  2. 参考链接:【CUDA】Ubuntu系统如何安装CUDA保姆级教程(2022年最新)_ubuntu安装cuda-CSDN博客

  3. 选择你的平台,例如:

    • Operating System: Linux

    • Architecture: x86_64

    • Distribution: Ubuntu

    • Version: 20.04

    • Installer Type: deb (local) 推荐

    • CUDA Version: 12.3 或 12.4(推荐)

  4. 按照生成的命令依次执行,例如:

    复制代码
    sudo dpkg -i cuda-repo-ubuntu2004-12-3-local_12.3.0-1_amd64.deb
    sudo cp /var/cuda-repo-ubuntu2004-12-3-local/cuda-*-keyring.gpg /usr/share/keyrings/
    sudo apt-get update
    sudo apt-get -y install cuda

✅ 步骤四:配置环境变量

编辑 .bashrc.zshrc

复制代码
nano ~/.bashrc

添加以下内容(假设安装在 /usr/local/cuda):

复制代码
export PATH=/usr/local/cuda/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH

保存后执行:

复制代码
source ~/.bashrc

✅ 步骤五:验证 CUDA 安装是否成功

复制代码
nvcc --version

期望输出:

复制代码
Cuda compilation tools, release 12.3, V12.3.xxx

✅ 附加验证(可选)

测试 CUDA 示例程序:

复制代码
cd /usr/local/cuda/samples/1_Utilities/deviceQuery
sudo make
./deviceQuery

输出信息中如出现:

复制代码
Result = PASS

表示 CUDA 可正常运行。


✅ 总结

步骤 是否完成 说明
驱动安装 使用 ubuntu-drivers 推荐版本
Secure Boot 禁用 否则 nvidia-smi 报错
CUDA 安装 推荐安装 CUDA 12.3 官方包
环境变量配置 添加 PATH 和 LD_LIBRARY_PATH
nvidia-smi 正常 GPU 驱动运行正常
nvcc --version 正常 CUDA 编译器可用
相关推荐
A小辣椒1 小时前
TShark:基础知识
linux
AlfredZhao3 小时前
OCI 明明分配了 200G 系统盘,为什么 df 只看到 30G?
linux·oci
AlfredZhao18 小时前
vi 删除指定范围的行,不用再反复按 dd
linux·vi
用户9718356334661 天前
银河麒麟 KY10 申威(SW64) 安装 nginx-1.16.1-2.p01.ky10.sw_64.rpm 详细步骤
linux
猪脚踏浪1 天前
linux 拷贝文件或目录到指定的位置
linux
摇滚侠2 天前
Linux CentOS7 rpm 安装 MySQL 5.7
linux·运维·mysql
bush42 天前
嵌入式linux学习记录十四、术语
linux·嵌入式
载数而行5202 天前
Linux 11 动态监控指令top
linux
不会C语言的男孩2 天前
Linux 系统编程 · 第 8 章:进程基础
linux·c语言
古城小栈2 天前
Unix 与 Linux 异同小叙
linux·服务器·unix