服务器 CUDA版本升级指南

在深度学习开发中,我们常被一个误区困扰:使用 nvidia-smi 查到的 CUDA 版本(驱动支持的最高版本),并不等同于当前环境实际调用的 CUDA Toolkit 版本(nvcc -V)。

nvidia-smi 反应的是显卡驱动 (Driver) 能够支持的 CUDA 最大版本,它决定了你能运行多高版本的 Toolkit,但并不强制要求你的项目环境必须使用这个最高版本。

当前环境实际调用的 CUDA Toolkit 版本(nvcc -V

首先查看系统中已安装的 CUDA 版本目录:

bash 复制代码
ls -l /usr/local

安装目标 CUDA 版本

前往 NVIDIA 官网 下载对应版本的安装包 (推荐安装CUDA Toolkit 12.4.1)

或者根据 PyTorch 下载 CUDA 版本

python 复制代码
import torch
print(torch.__version__)
print(torch.version.cuda)
bash 复制代码
sudo sh cuda_12.4.1_550.54.15_linux.run

开始运行后等待时间比较久

💡 安装时的重要提醒:

在安装 NVIDIA 官方 CUDA Toolkit 时,安装程序通常会询问是否要安装显卡驱动(Driver)。如果你所在的服务器已经有正常工作的驱动,一定要取消勾选 Driver 的安装,只安装 Toolkit,否则可能会导致显卡驱动覆盖错误,导致 nvidia-smi 失效。

然后

bash 复制代码
# 编辑文件
vim ~/.bashrc

# 在末尾添加
export PATH=/usr/local/cuda/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH

# 保存退出并使其立即生效
source ~/.bashrc

检查软链接:如果您的系统中安装了多个版本的CUDA,可能需要更新软链接/usr/local/cuda指向新版本的CUDA。您可以删除旧的软链接并创建一个新的指向CUDA 12.2的软链接:

bash 复制代码
sudo rm /usr/local/cuda
sudo ln -s /usr/local/cuda-12.4 /usr/local/cuda

这样,/usr/local/cuda就会指向CUDA 12.4的安装目录。

成功后,再进行 nvcc -V

相关推荐
zzzzzz3101 天前
9K Star 炸裂开源!这个 C 语言写的代码知识图谱,把 Linux 内核索引压缩到了 3 分钟
linux·服务器·sql
XIAOHEZIcode1 天前
Linux系统鼠标偏移常见原因以及修复方案
linux·运维·游戏
用户0328472220702 天前
如何搭建本地yum源(上)
运维
大树885 天前
金刚石散热越强,管路越先见顶
大数据·运维·服务器·人工智能·ai
摇滚侠5 天前
Linux CentOS7 rpm 安装 MySQL 5.7
linux·运维·mysql
霸道流氓气质5 天前
领域驱动设计(DDD)在 Spring Boot 微服务中的实践指南
运维·spring boot·微服务
小宇宙Zz5 天前
Maven依赖冲突
java·服务器·maven
Inhand陈工5 天前
基于台达PLC与映翰通IG502的智慧水产养殖精准投喂与远程运维解决方案
运维·人工智能·物联网·阿里云·信息与通信
酣大智5 天前
ARP代理--工作原理
运维·网络·arp·arp代理
shushangyun_5 天前
2026年快消品B2B系统推荐:支持终端门店订货、促销政策自动化的工具?
java·运维·网络·数据库·人工智能·spring·自动化