【Ubuntu | Nvidia | driver | installation | commend】

文章目录

Nvidia

安装步骤

1.Ubuntu系统确认

内核
  1. 检查当前内核版本
    uname --r

    5.4.0-174-generic

  2. 查看已安装的内核

    ··dpkg --list | grep linux-image

  3. 锁定内核版本(防止自动更新升级),后面安装驱动等会使用自动更新命令

bash 复制代码
# 锁定内核版本
sudo apt-mark hold linux-image-generic linux-headers-generic
 
# 如需恢复更新执行
sudo apt-mark unhold linux-image-generic linux-headers-generic
 
# 检查锁定状态:
apt-mark showhold
2. 安装驱动前 一定要更新 软件列表并安装安装必要软件、依赖!!!
bash 复制代码
sudo apt-get update      #更新软件列表
sudo apt-get install g++
sudo apt-get install gcc
sudo apt-get install make



3.禁用nouveau
  1. 创建文件

    vim /etc/modprobe.d/blacklist-nouveau.conf

  2. 在文件末尾插入以下内容,将nouveau加入黑名单,默认不开启

    blacklist nouveau

    options nouveau modeset=0

  3. 使禁用生效然后重启

    sudo update-initramfs -u #更新系统

    sudo reboot

  4. 验证是否禁用nouveau,没有内容输出则证明禁用成功

    lsmod | grep nouveau
    以下图片/截图是借用他人的,参考如下:https://blog.csdn.net/ytusdc/article/details/132403852

    因为我的Ubuntu在操作过程中,在前人的配置的时候已经配置禁用了、

4.先完全卸载之前的Nvidia驱动

注意:不进入 tty 界面卸载驱动也可以, 没有报错

4.1.1 (方式一) 卸载ppa方式安装的nvidia驱动
4.1.2卸载.run方式安装的nvidia驱动(方式二
4.2 检查是否有该驱动?nvidia-smi

nvidia-smi

卸载?

卸载旧版本的

  1. sudo apt-get --purge remove "*nvidia*"

sudo apt-get --purge remove "nvidia" sudo /usr/bin/nvidia-uninstall



  1. sudo apt-get remove --purge nvidia* 【】参考

    sudo apt-get remove --purge nvidia*

  2. apt-get remove --purge "cublas " "cuda*" # 卸载 cuda

  3. apt-get autoremove # 卸载不再需要的库

python 复制代码
在这里
# 1.查看当前安装的软件,只能查看apt install方式安装的nvidia软件,无法查看.run文件安装的nvidia驱动
sudo dpkg --list | grep nvidia-*
sudo apt list --installed | grep nvidia
# 2. 先关闭图形界面,然后按alt+f2,进入tty
sudo service gdm3 stop
# 3. 卸载nvidia相关软件及配置,卸载完成后使用第一个
sudo apt-get --purge remove nvidia*
sudo apt --purge autoremove
# 4. 重启电脑
reboot
# 5. 查看当前的nvidia驱动
ls /usr/src | grep nvidia

【!!![参考卸载~~~] (https://nvidiadrive.csdn.net/696eefd0437a6b40336966d8.html)】

检查是否干净?

  • dpkg -l | grep nvidia

  • lsmod | grep nvidia

  • ls /usr/src | grep nvidia

没有卸载干净怎么办???

参考:cankao =

bash 复制代码
# 首先查找CUDA安装目录中的卸载工具
find /usr/local -name "*uninstall*" -type f
 
# 如果找到cuda-uninstaller,使用它
sudo /usr/local/cuda/bin/cuda-uninstaller
 
# 对于NVIDIA驱动,查找并运行卸载脚本
find /usr -name "nvidia-uninstall" -type f 2>/dev/null
# 如果找到,执行
sudo /path/to/nvidia-uninstall

继续检查并卸载、清澈干净

清除干净

1.dpkg -l | grep -i nvidia

  1. lsmod | grep nvidia

  2. dkms status

  3. ls /usr/src | grep nvidia

  4. ls -l /usr/local | grep cuda

  1. sudo rm -rf /usr/src/nvidia-535.161.07

  2. sudo rm -rf /usr/local/cuda*

ls -l /usr/local | grep cuda

ls /usr/src | grep nvidia

==== = =

安装

1.查询最适合驱动版本

bash 复制代码
ubuntu-drivers devices

2.用命令行进行安装 加粗样式

bash 复制代码


在这里插入图片描述

安装错误?

为什么会失败? 这种编译失败 99% 的原因只有一个:你的系统里缺少编译所需的"内核头文件 (linux-headers)"或基础的 C/C++ 编译工具链(build-essential)。没有图纸和工具,系统自然无法完成驱动模块的构建。

  1. 先卸载
    彻底清理旧驱动(必须做)
c 复制代码
sudo apt-get purge 'nvidia-*'
sudo apt-get autoremove
sudo apt-get autoclean


  1. 安装编译环境:补齐编译环境和内核头文件(最关键)
    让系统下载编译驱动必需的核心工具:

sudo apt-get update

sudo apt-get install -y dkms build-essential linux-headers-$(uname -r)

bash 复制代码
sudo apt-get update

sudo apt-get install -y build-essential dkms \
linux-headers-$(uname -r)


没有gcc


解救额:解决
sudo apt-get install --reinstall gcc

c 复制代码
sudo apt-get update
sudo apt-get install --reinstall gcc

清理残骸并安装驱动(决战时刻)-清扫之前失败的残次品

c 复制代码
sudo apt autoremove -y

安装重启

··正式安装闭源稳定版驱动:
sudo apt-get install -y nvidia-driver-535

这一次,有 gcc 为底层的 DKMS 模块编译保驾护航,你应该不会再看到那个恶心的 Error 报错了。等进度条安稳跑完,执行 sudo reboot 重启服务器,你的显卡就可以满血复活了。

检查

nvidia-smi

==== = =

Ubuntu

实时查看现存使用情况

watch -n 10 nvidia-smi

Nvidia

查询driver

https://www.nvidia.com/en-us/geforce/drivers/

https://www.nvidia.cn/geforce/drivers/

https://www.nvidia.com/en-us/drivers/results/

查询Ubuntu当前操作系统中的位数

如何在Ubuntu系统中检测当前操作系统的位数。
uname --m

x86_64

reference-data

sudo uname --s 显示内核名字s

sudo uname --r 显示内核版本

sudo uname --n 显示网络主机名

sudo uname --p 显示cpu

查找本服务器中的GPU型号指南

reference
refrence2

  1. 查出PCI信息
    先通过lspci查出PCI信息

    lspci -nn |grep -i nvidia

lspci :列出系统中所有 PCI(Peripheral Component Interconnect,外设组件互连标准 )设备的信息, -nn 选项让输出同时包含设备的厂商 / 设备 ID(以十六进制数字对形式,如 [10de:20f3] ),方便精准识别设备 。

grep -i nvidia :筛选出包含 "nvidia" 关键字的行( -i 表示忽略大小写匹配 ),只展示 NVIDIA 相关设备信息。

2.查出卡信息

根据PCI ID查VendorID

lspci -nn -s 10 : 00.0

`lspci -nn -s 10 : 00.0 中 10:00.0 对应在通过lspci -nn |grep -i nvidia

或者 lspci -nn -s 21:00.0在VGA最后方括号中[]所看到的设备ID

请在PCI 网站上查看

资料

cankao :

参考

谢谢谢谢

1.tut-tutoral

  1. Nvidia-derver

  2. 3.感谢我的gemini

相关推荐
qq_5425154137 分钟前
Ubuntu 22.04.4 LTS安装ToDesk最新版打不开,无响应?旧版本4.7.2_277版本分享
linux·ubuntu·todesk
火车叼位42 分钟前
替代 Tiny Win10 的 Linux 方案:Debian XFCE 精简桌面搭建
linux·运维
小麦嵌入式1 小时前
FPGA入门(四):时序逻辑计数器原理与 LED 闪烁实现
linux·驱动开发·stm32·嵌入式硬件·fpga开发·硬件工程·dsp开发
皮卡蛋炒饭.2 小时前
传输层协议UDP
linux·网络协议·udp
大明者省2 小时前
宝塔开了端口,Ubuntu 还得开相应端口才能打通
服务器·数据库·ubuntu
syagain_zsx2 小时前
Linux指令初识(实用篇)
linux·运维·服务器
OYangxf2 小时前
Git Commit Message
运维·git
Alter12303 小时前
从“力大砖飞”到“拟态共生”,新华三定义AI基础设施的系统级进化
大数据·运维·人工智能
王木风3 小时前
终端里的编程副驾:DeepSeek-TUI-项目深度拆解,实测与原理分析
linux·运维·人工智能·rust·node.js
槑槑紫3 小时前
windows系统装轻量版linux开发
linux·运维·服务器