ubuntu 22.04安装NVIDIA驱动和CUDA

新拿到一个服务器,发现啥都没有。于是就安装

1.安装驱动

禁用自带显卡驱动nouveau

lsmod | grep nouveau

这个有输出代表该驱动存在

vim /etc/modprobe.d/blacklist.conf

在文件末尾添加

python 复制代码
blacklist nouveau
options nouveau modeset=0

update-initramfs -u 更新

reboot 重启机器

参考:https://dotatong.com/index.php/archives/117/

apt安装,简单些

先输入,检查机器可以安装哪些版本的

ubuntu-drivers devices

这里最新支持560。

于是

python 复制代码
add-apt-repository ppa:graphics-drivers/ppa
apt-get update
apt-get install  nvidia-driver-560 nvidia-settings nvidia-prime

参考:https://www.cnblogs.com/Maker-Liu/p/16575241.html

nvidia-smi输出结果即为成功。也可以重启机器再看

物理安装

首先下载驱动文件

wget https://cn.download.nvidia.com/XFree86/Linux-x86_64/550.100/NVIDIA-Linux-x86_64-550.100.run

chmod 755 NVIDIA-Linux-x86_64-550.100.run 加执行权限

./NVIDIA-Linux-x86_64-550.100.run -no-x-check 安装

一路点点点

但是我重启了机器后驱动又不见了。

2.cuda安装

先卸载旧的cuda:

python 复制代码
sudo apt-get --purge remove cuda*
sudo apt-get --purge remove libcudnn*
sudo apt-get --purge remove libnccl*
sudo apt-get --purge remove libcuda*

which nvcc应该不输出

官方安装最新的教程:
https://developer.nvidia.com/cuda-downloads?target_os=Linux\&target_arch=x86_64\&Distribution=Ubuntu\&target_version=22.04\&target_type=deb_network

根据其安装,完成后nvcc -V也是找不到。是软连接的问题

python 复制代码
确保 /usr/local/cuda 指向 CUDA 12.6
sudo rm -rf /usr/local/cuda
sudo ln -s /usr/local/cuda-12.6 /usr/local/cuda
nano ~/.bashrc
将下面两行写入到最下面
export PATH=/usr/local/cuda/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH
source ~/.bashrc

成功

也可以看
https://forums.developer.nvidia.com/t/nvidia-smi-has-failed-because-it-couldnt-communicate-with-the-nvidia-driver-make-sure-that-the-latest-nvidia-driver-is-installed-and-running/197141/6

相关推荐
志栋智能几秒前
超自动化运维如何重塑IT组织的核心竞争力?
运维·服务器·网络·数据库·人工智能·自动化
@insist1238 分钟前
网络工程师-交换机核心配置完全指南
运维·服务器·网络·网络工程师·软考·软件水平考试
handler0110 分钟前
Linux基础知识(1)
linux·服务器·c语言·开发语言·数据结构·c++
ん贤14 分钟前
手敲Linux命令
linux·运维·服务器
Drache_long19 分钟前
Docker(一)
运维·docker·容器
泽020220 分钟前
OJBalancer ----- 基于负载均衡仿leetcode的刷题界面
linux·leetcode·负载均衡
爱学习的小囧22 分钟前
SXi LAG 链路聚合负载均衡配置全教程 | LACP 协议 + 交换机联动,新手也能落地
运维·服务器·php·负载均衡·esxi
尽兴-22 分钟前
Dubbo 负载均衡原理与服务调用全解析
运维·负载均衡·dubbo·轮询算法·一致性哈希·平滑加权轮询·随机算法
花间相见25 分钟前
【Linux进阶01】—— tmux原理与实战教程
linux·运维·服务器
jinanwuhuaguo26 分钟前
Ollama 全方位深度剖析:大模型时代的“Docker化”革命、算力普惠基础设施与安全边界重构
运维·开发语言·人工智能·深度学习·安全·docker·重构