NVIDIA显卡驱动、CUDA、cuDNN 和 TensorRT 版本匹配指南

1、下载驱动

前往NVIDIA驱动下载页，输入显卡型号和操作系统类型，选择≥目标CUDA版本要求的驱动版本‌。

2、安装驱动‌

3、验证

运行nvidia-smi，检查驱动版本是否满足要求‌。

1）NVIDIA 显卡驱动需满足 CUDA 工具包的最低要求，例如 CUDA 11.8 需驱动版本 ≥515.43.04，CUDA 12.x 需驱动 ≥535.54.03‌

显卡驱动查询方法‌：输入命令：nvidia-smi，输出右上角显示 ‌CUDA Version: 12.5 即最高支持的 CUDA 版本‌。

2）CUDA版本所需的最低驱动版本。

访问NVIDIA官方文档‌，进入CUDA Toolkit Release Notes ，查找目标CUDA版本对应的驱动版本要求‌。

**注意：**驱动是向下兼容的，其决定了可安装的CUDA Toolkit的最高版本。

‌显卡算力与CUDA版本的关系主要体现在显卡的Compute Capability（算力）决定了支持的CUDA版本。‌

NVIDIA显卡的算力是通过Compute Capability（CC）来衡量的，不同的显卡有不同的CC值。例如，NVIDIA的RTX A2000显卡的算力为8.6，即CC为8.6‌1。CUDA版本需要支持显卡的CC值，否则会出现兼容性问题。

比如：GeForce RTX 3080 算力8.6

‌CUDA 与 cuDNN‌：需严格匹配，例如 CUDA 11.8 对应 cuDNN 8.6.0，CUDA 12.2 对应 cuDNN 8.9.0‌。

‌TensorRT 依赖‌：必须与 CUDA、cuDNN 版本一致（如 TensorRT 8.5.3.1 需 CUDA 11.8 + cuDNN 8.6.0）‌。

1）打开TensorRT官网说明文档，查看各版本支持的计算能力。

从上面列表中，点击打开一个链接，有该TensorRT版本适配CUDA版本和cuDNN版本。比如：NVIDIA TensorRT 8.6.1 打开后选择"Support Matrix"链接。

点击打开链接后，搜索"Supported Features per Platform"，里面就有CUDA、cuDNN版本。

注意文档最后注角解释，有些限制条件。

搜索"Compute Capability per Platform"，查看支持的算力。每个型号显卡都有对应的算力。

搜索"Software Versions Per Platform"，查看一些软件版本。

显卡系列	驱动版本	CUDA 版本	cuDNN 版本	TensorRT 版本
‌RTX 40 系‌	≥535.54.03	12.2	8.9.0	10.0.0.1
‌RTX 30 系‌	≥515.43.04	11.8	8.6.0	8.5.3.1
通用兼容方案	≥545.84	12.3	8.9.7(适配 12.x)	8.6.1
‌Titan V/RTX 20系‌	≥470.82	11.1	8.2.1	8.2.4.2

显卡驱动‌ → ‌Visual Studio（可选）‌ → ‌CUDA‌ → ‌cuDNN‌ → ‌TensorRT‌‌。
Windows 示例‌：安装 CUDA 12.2 时需先卸载旧版本驱动，避免冲突‌。

CUDA‌：终端输入 nvcc --version，输出显示 CUDA 编译工具版本‌。

cuDNN‌：在 Python 中执行 torch.cuda.cudnn_version() 或检查安装目录的版本文件‌。TensorRT‌：运行 trtexec --version 或检查安装目录的版本文件‌。

1）优先通过 NVIDIA 官网下载驱动，避免使用系统自动更新（可能导致版本不匹配）。

2）若 CUDA 版本与驱动不兼容，需降级驱动或升级 CUDA。

1）、使用 TensorRT 官方测试过的组合（如 CUDA 12.2 + cuDNN 8.9.0 + TensorRT 10.0.0.1），可减少推理时延。

2）、避免混用不同版本的 CUDA 动态库（如同时安装 CUDA 11.x 和 12.x）。