【机器学习】Ubuntu系统下显卡驱动卸载及重装

目录

背景

驱动卸载

驱动安装

CUDA驱动安装

安装nvidia-smi


背景

这里包含显卡驱动和CUDA驱动,在如下场景下,我们需要卸载显卡驱动并重新安装。

  1. 在某些情况下需要对显卡驱动进行升级
  2. 某些情况下(如重启,或者调整系统配置等),系统出问题导致显卡驱动掉了,需要重新安装

在上述过程中,经常会出现一些问题导致显卡驱动安装失败,本文参考官方给定的一些方式安装。

驱动卸载

  1. 使用apt卸载相应驱动(不用care是否存在)

    复制代码
    sudo apt --purge remove nvidia*
    sudo apt --purge remove "*cublas*" "cuda*"
    sudo apt --purge remove "*nvidia*
    sudo apt autoremove
  2. 上述操作完成后,并不一定生效,还要使用安装后提供的工具卸载存在的驱动 这里的文件不一定存在,取决于一开始的cuda 安装方式,如果不存在,直接跳过即可

    复制代码
    # 这里会弹出界面让你确认卸载内容,根据提示操作即可,选择上所有组件进行卸载
    sudo /usr/local/cuda-**.*/bin/cuda-uninstaller
    
    # 完成上述操作后,可能会有残留文件需要阐述
    sudo rm -rf /usr/local/cuda*

卸载完驱动后,需要重启。

驱动安装

CUDA驱动安装

官网参考

以CUDA 12.3 为例。注意,如果使用官方run文件的形式安装可能会报错,推荐如下方式安装。

复制代码
wget <https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2204/x86_64/cuda-ubuntu2204.pin>
sudo mv cuda-ubuntu2204.pin /etc/apt/preferences.d/cuda-repository-pin-600
wget <https://developer.download.nvidia.com/compute/cuda/12.3.2/local_installers/cuda-repo-ubuntu2204-12-3-local_12.3.2-545.23.08-1_amd64.deb>
sudo dpkg -i cuda-repo-ubuntu2204-12-3-local_12.3.2-545.23.08-1_amd64.deb
sudo cp /var/cuda-repo-ubuntu2204-12-3-local/cuda-*-keyring.gpg /usr/share/keyrings/
sudo apt-get update
sudo apt-get -y install cuda-toolkit-12-3

完成上述安装后,nvcc -V命令应该可以正常工作,但nvidia-smi无法正常工作。

安装nvidia-smi

复制代码
sudo add-apt-repository ppa:graphics-drivers/ppa
sudo apt update

sudo apt search nvidia-driver
# 选择上述内容列表中自己需要的/最新的
sudo apt install -y nvidia-driver-550

安装完成后,重启后nvidia-smi即可生效。

相关推荐
沧浪之水!8 分钟前
【Linux网络】:套接字之UDP
linux·网络·udp
BranH10 分钟前
Linux系统中命令设定临时IP
linux·运维·服务器
秋风起,再归来~28 分钟前
【Linux庖丁解牛】—进程优先级!
linux·运维·服务器
小宋加油啊30 分钟前
深度学习小记(包括pytorch 还有一些神经网络架构)
pytorch·深度学习·神经网络
沛沛老爹33 分钟前
从线性到非线性:简单聊聊神经网络的常见三大激活函数
人工智能·深度学习·神经网络·激活函数·relu·sigmoid·tanh
cosX+sinY1 小时前
ubuntu 20.04 编译运行lio-sam,并保存为pcd
linux·ubuntu·机器人
何大春1 小时前
【视频时刻检索】Text-Video Retrieval via Multi-Modal Hypergraph Networks 论文阅读
论文阅读·深度学习·神经网络·计算机视觉·视觉检测·论文笔记
旧故新长2 小时前
支持Function Call的本地ollama模型对比评测-》开发代理agent
人工智能·深度学习·机器学习
Lary_Rock2 小时前
Android 编译问题 prebuilts/clang/host/linux-x86
android·linux·运维
熬夜学编程的小王2 小时前
【Linux篇】理解信号:如何通过信号让程序听从操作系统的指令
linux·信号产生·软件条件产生信号