服务器 CUDA版本升级指南

在深度学习开发中,我们常被一个误区困扰:使用 nvidia-smi 查到的 CUDA 版本(驱动支持的最高版本),并不等同于当前环境实际调用的 CUDA Toolkit 版本(nvcc -V)。

nvidia-smi 反应的是显卡驱动 (Driver) 能够支持的 CUDA 最大版本,它决定了你能运行多高版本的 Toolkit,但并不强制要求你的项目环境必须使用这个最高版本。

当前环境实际调用的 CUDA Toolkit 版本(nvcc -V

首先查看系统中已安装的 CUDA 版本目录:

bash 复制代码
ls -l /usr/local

安装目标 CUDA 版本

前往 NVIDIA 官网 下载对应版本的安装包 (推荐安装CUDA Toolkit 12.4.1)

或者根据 PyTorch 下载 CUDA 版本

python 复制代码
import torch
print(torch.__version__)
print(torch.version.cuda)
bash 复制代码
sudo sh cuda_12.4.1_550.54.15_linux.run

开始运行后等待时间比较久

💡 安装时的重要提醒:

在安装 NVIDIA 官方 CUDA Toolkit 时,安装程序通常会询问是否要安装显卡驱动(Driver)。如果你所在的服务器已经有正常工作的驱动,一定要取消勾选 Driver 的安装,只安装 Toolkit,否则可能会导致显卡驱动覆盖错误,导致 nvidia-smi 失效。

然后

bash 复制代码
# 编辑文件
vim ~/.bashrc

# 在末尾添加
export PATH=/usr/local/cuda/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH

# 保存退出并使其立即生效
source ~/.bashrc

检查软链接:如果您的系统中安装了多个版本的CUDA,可能需要更新软链接/usr/local/cuda指向新版本的CUDA。您可以删除旧的软链接并创建一个新的指向CUDA 12.2的软链接:

bash 复制代码
sudo rm /usr/local/cuda
sudo ln -s /usr/local/cuda-12.4 /usr/local/cuda

这样,/usr/local/cuda就会指向CUDA 12.4的安装目录。

成功后,再进行 nvcc -V

相关推荐
CQU_JIAKE1 小时前
4.17[Q]
java·linux·服务器
上海云盾-小余2 小时前
DDoS 攻击应急响应全流程:从告警触发到业务恢复的黄金 15 分钟
服务器·安全·游戏·ddos
LXY_BUAA2 小时前
《ubuntu22.04》_新系统的配置_20260418
linux·运维·服务器
上海云盾-小余2 小时前
API 接口 DDoS 与 CC 攻击防护实战:守住业务最脆弱的数字入口
服务器·ddos
楼田莉子2 小时前
同步/异步日志系统:日志落地模块\日志器模块\异步日志模块
linux·服务器·c++·学习·设计模式
NightReader3 小时前
SSH Client推荐集
运维·ssh
探索宇宙真理.4 小时前
Nginx UI MCP接口绕过认证漏洞 | CVE-2026-33032复现&研究
运维·经验分享·网络安全·nginx-ui
llm大模型算法工程师weng4 小时前
负载均衡做什么?nginx是什么
运维·开发语言·nginx·负载均衡
byoass5 小时前
企业云盘私有化部署:存储架构设计与安全运维全流程实战
运维·网络·安全·云计算