【Ubuntu | Nvidia | driver | installation | commend】

文章目录

Nvidia

安装步骤

1.Ubuntu系统确认

内核
  1. 检查当前内核版本
    uname --r

    5.4.0-174-generic

  2. 查看已安装的内核

    ··dpkg --list | grep linux-image

  3. 锁定内核版本(防止自动更新升级),后面安装驱动等会使用自动更新命令

bash 复制代码
# 锁定内核版本
sudo apt-mark hold linux-image-generic linux-headers-generic
 
# 如需恢复更新执行
sudo apt-mark unhold linux-image-generic linux-headers-generic
 
# 检查锁定状态:
apt-mark showhold
2. 安装驱动前 一定要更新 软件列表并安装安装必要软件、依赖!!!
bash 复制代码
sudo apt-get update      #更新软件列表
sudo apt-get install g++
sudo apt-get install gcc
sudo apt-get install make



3.禁用nouveau
  1. 创建文件

    vim /etc/modprobe.d/blacklist-nouveau.conf

  2. 在文件末尾插入以下内容,将nouveau加入黑名单,默认不开启

    blacklist nouveau

    options nouveau modeset=0

  3. 使禁用生效然后重启

    sudo update-initramfs -u #更新系统

    sudo reboot

  4. 验证是否禁用nouveau,没有内容输出则证明禁用成功

    lsmod | grep nouveau
    以下图片/截图是借用他人的,参考如下:https://blog.csdn.net/ytusdc/article/details/132403852

    因为我的Ubuntu在操作过程中,在前人的配置的时候已经配置禁用了、

4.先完全卸载之前的Nvidia驱动

注意:不进入 tty 界面卸载驱动也可以, 没有报错

4.1.1 (方式一) 卸载ppa方式安装的nvidia驱动
4.1.2卸载.run方式安装的nvidia驱动(方式二
4.2 检查是否有该驱动?nvidia-smi

nvidia-smi

卸载?

卸载旧版本的

  1. sudo apt-get --purge remove "*nvidia*"

sudo apt-get --purge remove "nvidia" sudo /usr/bin/nvidia-uninstall



  1. sudo apt-get remove --purge nvidia* 【】参考

    sudo apt-get remove --purge nvidia*

  2. apt-get remove --purge "cublas " "cuda*" # 卸载 cuda

  3. apt-get autoremove # 卸载不再需要的库

python 复制代码
在这里
# 1.查看当前安装的软件,只能查看apt install方式安装的nvidia软件,无法查看.run文件安装的nvidia驱动
sudo dpkg --list | grep nvidia-*
sudo apt list --installed | grep nvidia
# 2. 先关闭图形界面,然后按alt+f2,进入tty
sudo service gdm3 stop
# 3. 卸载nvidia相关软件及配置,卸载完成后使用第一个
sudo apt-get --purge remove nvidia*
sudo apt --purge autoremove
# 4. 重启电脑
reboot
# 5. 查看当前的nvidia驱动
ls /usr/src | grep nvidia

【!!!参考卸载\~\~\~ (https://nvidiadrive.csdn.net/696eefd0437a6b40336966d8.html)】

检查是否干净?

  • dpkg -l | grep nvidia

  • lsmod | grep nvidia

  • ls /usr/src | grep nvidia

没有卸载干净怎么办???

参考:cankao =

bash 复制代码
# 首先查找CUDA安装目录中的卸载工具
find /usr/local -name "*uninstall*" -type f
 
# 如果找到cuda-uninstaller,使用它
sudo /usr/local/cuda/bin/cuda-uninstaller
 
# 对于NVIDIA驱动,查找并运行卸载脚本
find /usr -name "nvidia-uninstall" -type f 2>/dev/null
# 如果找到,执行
sudo /path/to/nvidia-uninstall

继续检查并卸载、清澈干净

清除干净

1.dpkg -l | grep -i nvidia

  1. lsmod | grep nvidia

  2. dkms status

  3. ls /usr/src | grep nvidia

  4. ls -l /usr/local | grep cuda

  1. sudo rm -rf /usr/src/nvidia-535.161.07

  2. sudo rm -rf /usr/local/cuda*

ls -l /usr/local | grep cuda

ls /usr/src | grep nvidia

==== = =

安装

1.查询最适合驱动版本

bash 复制代码
ubuntu-drivers devices

2.用命令行进行安装 加粗样式

bash 复制代码


在这里插入图片描述

安装错误?

为什么会失败? 这种编译失败 99% 的原因只有一个:你的系统里缺少编译所需的"内核头文件 (linux-headers)"或基础的 C/C++ 编译工具链(build-essential)。没有图纸和工具,系统自然无法完成驱动模块的构建。

  1. 先卸载
    彻底清理旧驱动(必须做)
c 复制代码
sudo apt-get purge 'nvidia-*'
sudo apt-get autoremove
sudo apt-get autoclean


  1. 安装编译环境:补齐编译环境和内核头文件(最关键)
    让系统下载编译驱动必需的核心工具:

sudo apt-get update

sudo apt-get install -y dkms build-essential linux-headers-$(uname -r)

bash 复制代码
sudo apt-get update

sudo apt-get install -y build-essential dkms \
linux-headers-$(uname -r)


没有gcc


解救额:解决
sudo apt-get install --reinstall gcc

c 复制代码
sudo apt-get update
sudo apt-get install --reinstall gcc

清理残骸并安装驱动(决战时刻)-清扫之前失败的残次品

c 复制代码
sudo apt autoremove -y

安装重启

··正式安装闭源稳定版驱动:
sudo apt-get install -y nvidia-driver-535

这一次,有 gcc 为底层的 DKMS 模块编译保驾护航,你应该不会再看到那个恶心的 Error 报错了。等进度条安稳跑完,执行 sudo reboot 重启服务器,你的显卡就可以满血复活了。

检查

nvidia-smi

==== = =

Ubuntu

实时查看现存使用情况

watch -n 10 nvidia-smi

Nvidia

查询driver

https://www.nvidia.com/en-us/geforce/drivers/

https://www.nvidia.cn/geforce/drivers/

https://www.nvidia.com/en-us/drivers/results/

查询Ubuntu当前操作系统中的位数

如何在Ubuntu系统中检测当前操作系统的位数。
uname --m

x86_64

reference-data

sudo uname --s 显示内核名字s

sudo uname --r 显示内核版本

sudo uname --n 显示网络主机名

sudo uname --p 显示cpu

查找本服务器中的GPU型号指南

reference
refrence2

  1. 查出PCI信息
    先通过lspci查出PCI信息

    lspci -nn |grep -i nvidia

lspci :列出系统中所有 PCI(Peripheral Component Interconnect,外设组件互连标准 )设备的信息, -nn 选项让输出同时包含设备的厂商 / 设备 ID(以十六进制数字对形式,如 10de:20f3 ),方便精准识别设备 。

grep -i nvidia :筛选出包含 "nvidia" 关键字的行( -i 表示忽略大小写匹配 ),只展示 NVIDIA 相关设备信息。

2.查出卡信息

根据PCI ID查VendorID

lspci -nn -s 10 : 00.0

`lspci -nn -s 10 : 00.0 中 10:00.0 对应在通过lspci -nn |grep -i nvidia

或者 lspci -nn -s 21:00.0在VGA最后方括号中\[\]所看到的设备ID

请在PCI 网站上查看

资料

cankao :

参考

谢谢谢谢

1.tut-tutoral

  1. Nvidia-derver

  2. 3.感谢我的gemini

相关推荐
OpsEye2 分钟前
系统负载高一定是CPU问题吗?
运维·cpu·it
Titan20241 小时前
Linux动静态库
linux·服务器·c++
AOwhisky1 小时前
MySQL 学习笔记(第六期):MySQL 备份与恢复
运维·数据库·笔记·学习·mysql·云计算
赵民勇1 小时前
Linux file命令详解
linux·运维
li-xun2 小时前
LINUX DO 社区注册机制调整与公益 AI 服务动态
linux·运维·人工智能
j_xxx404_2 小时前
MySQL表操作硬核解析:从 CREATE TABLE 到磁盘文件、ALTER TABLE 与 DDL 风险
运维·服务器·数据库·c++·mysql·adb·ai
ba_pi2 小时前
k8s删除pod
linux·容器·kubernetes
前端程序猿i2 小时前
Nginx 教程:从入门到能上线
运维·nginx
木雷坞2 小时前
Qdrant Docker 部署教程:数据卷、API Key 和集合初始化
运维·docker·容器·知识图谱
wuminyu2 小时前
Java锁机制之park和unpark源码剖析
java·linux·c语言·jvm·c++