AI服务器工作之ubuntu系统下的驱动安装

一、安装ssh远程连接

前提:ubunutu系统在前期没有选择安装ssh情况下

复制代码
sudo -i //切换root用户
sudo apt-get install openssh-server

以下输出为安装成功

二、更新系统

复制代码
sudo apt update //更新软件包的索引信息
sudo apt upgrade //升级已安装的软件包到最新版本
sudo apt dist-upgrade  //允许处理更复杂的依赖关系变化

三、禁用 Nouveau 驱动

复制代码
sudo vi /etc/modprobe.d/blacklist.conf
blacklist nouveau
blacklist lbm-nouveau
options nouveau modeset=0
alias nouveau off
alias lbm-nouveau off //在末尾加入
sudo update-initramfs -u //更新配置
重启之后输入 lsmod|grep nouveau 无反应,证明屏蔽 nouveau 成功
输入 sudo apt-get install lrzsz 来用 xshell 传输文件

四、安装驱动

驱动官网:https://www.nvidia.cn/

以PTX 50为例:

复制代码
wget https://download.nvidia.com/XFree86/Linux-x86_64/570.169/NVIDIA-Linux-x86_64-570.169.run
sudo chmod +x NVIDIA-Linux-x86_64-570.169.run
sudo apt install gcc //安装gcc
sudo apt install make //安装make

遇到下列情况,选择选项如下:

复制代码
reboot //安装完成后,重启计算机以确保新的驱动程序生效
nvidia-smi //查看驱动

五、cuda安装

下载cuda官方网址:CUDA Toolkit Archive | NVIDIA Developer

以cuda12.4网络下载为例:

复制代码
wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2004/x86_64/cuda-ubuntu2004.pin
sudo mv cuda-ubuntu2004.pin /etc/apt/preferences.d/cuda-repository-pin-600
wget https://developer.download.nvidia.com/compute/cuda/12.4.1/local_installers/cuda-repo-ubuntu2004-12-4-local_12.4.1-550.54.15-1_amd64.deb
sudo dpkg -i cuda-repo-ubuntu2004-12-4-local_12.4.1-550.54.15-1_amd64.deb
sudo cp /var/cuda-repo-ubuntu2004-12-4-local/cuda-*-keyring.gpg /usr/share/keyrings/
sudo apt-get update
sudo apt-get -y install cuda-toolkit-12-4
sudo apt-get install -y cuda-drivers
sudo apt-get install -y nvidia-driver-550-open
sudo apt-get install -y cuda-drivers-550

//临时环境变量生效
export PATH=/usr/local/cuda-12.4/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-12.4/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
source /etc/profile //使 cuda 生效

nvcc --version

出现下列输出表示安装成功:

相关推荐
小白电脑技术6 分钟前
飞牛漏洞焦虑?别瞎折腾WAF了!用Lucky五步搞定“防爬墙”
服务器·网络·安全
消失的旧时光-19437 分钟前
Nginx 是什么?为什么它不写在代码里?——从 0 认识 Nginx
运维·服务器·nginx
BJ_Bonree8 分钟前
4月17日,博睿数据受邀出席GOPS全球运维大会2026 · 深圳站!
大数据·运维·人工智能
RisunJan9 分钟前
Linux命令-lpq(查看打印队列状态)
linux·运维·服务器
山君爱摸鱼10 分钟前
Linux-服务进程
linux·运维·服务器
阿乐艾官11 分钟前
【linux文件系统重要目录及命令解释】
linux·运维·服务器
senijusene17 分钟前
Linux软件编程: Linux 操作系统基础与shell脚本
linux·运维·chrome
郝学胜-神的一滴33 分钟前
超越Spring的Summer(一): PackageScanner 类实现原理详解
java·服务器·开发语言·后端·spring·软件构建
乾元34 分钟前
身份与访问:行为生物识别(按键习惯、移动轨迹)的 AI 建模
运维·网络·人工智能·深度学习·安全·自动化·安全架构
ghostwritten36 分钟前
春节前夕,运维的「年关」:用 Kubeowler 给集群做一次「年终体检」
运维·云原生·kubernetes