机器学习环境搭建 Debian 12 安装Nvidia GPU Driver

本文参考机器学习环境搭建,唯一的区别在于Linux是Debian 12 而不是Ubuntu Server 22.04 LTS。演示的环境的硬件为AWS EC2 g4dn机型,它搭载了一颗服务器专用的T4 Tensor Core GPUAmazon EC2 G4dn 实例专用于加速机器学习推理和图形密集型工作负载,它搭载的T4 Tensor Core GPU有16GB的显存,非常适合中等负荷下的AI场景。本次我使用的是最经济的g4dn.xlarge。你自己也可以组装在你的个人电脑(需要Nvidia消费级显卡)上正常复现安装流程。

选择Debian 12的原因是因为相比Ubuntu Server LTS,Debian没有商业化气息,没有预装乱七八糟的无用的软件,更加稳定和纯洁。

同时Ubuntu Server LTS会定期更新Linux 内核版本,有些Linux 内核版本还不一定是LTS版,虽然从新硬件的支持和软件新特性的角度来看有好处,但是服务器场景用起来总感觉不如CentOS/RHEL和Debian稳定而且可能有软件兼容性问题。总之见仁见智吧~

安装Nvidia Driver

检查Linux服务器上的VGA显卡信息,我们可以看到Nvidia GPU的具体型号

bash 复制代码
lspci -nn | egrep -i "3d|display|vga"

修改/etc/apt/sources.list,确保添加了contribnon-freenon-free-firmware组件

bash 复制代码
deb http://deb.debian.org/debian/ bookworm main contrib non-free non-free-firmware

先更新Linux并安装必要的编译组件

bash 复制代码
sudo apt update -y && sudo apt upgrade -y && sudo apt install vim gcc g++ make python3-pip -y

安装必要的nvidia gpu驱动依赖组件

bash 复制代码
sudo apt install nvidia-detect -y
sudo apt install linux-headers-amd64 linux-headers-$(uname -r) build-essential libglvnd-dev pkg-config -y

安装nvidia gpu驱动

bash 复制代码
sudo apt install nvidia-driver firmware-misc-nonfree nvidia-kernel-dkms -y

重启

bash 复制代码
sudo reboot

检查驱动安装情况

bash 复制代码
nvidia-smi

参考

相关推荐
一灯架构1 天前
90%的人答错!一文带你彻底搞懂ArrayList
java·后端
mldong1 天前
Python开发者狂喜!200+课时FastAPI全栈实战合集,10大模块持续更新中🔥
后端
GreenTea1 天前
从 Claw-Code 看 AI 驱动的大型项目开发:2 人 + 10 个自治 Agent 如何产出 48K 行 Rust 代码
前端·人工智能·后端
Moment1 天前
AI 全栈指南:NestJs 中的 Service Provider 和 Module
前端·后端·面试
IT_陈寒1 天前
为什么我的JavaScript异步回调总是乱序执行?
前端·人工智能·后端
Moment1 天前
AI全栈入门指南:NestJs 中的 DTO 和数据校验
前端·后端·面试
小村儿1 天前
Harness Engineering:为什么你用 AI 越用越累?
前端·后端·ai编程
小码哥_常1 天前
为什么PUT和DELETE请求在大公司中逐渐被弃用?
后端
宫_商_角_徵1 天前
动态代理到底在做什么?
后端
苍何1 天前
我把微信 cli 开源了,群消息终于不用爬楼了!
后端