Ubuntu Nvidia GPU机器学习环境搭建(安装Nvidia Driver)

本文主要介绍为Ubuntu安装Nvidia GPU驱动,演示的环境的硬件为AWS EC2 g4dn机型,它搭载了一颗服务器专用的T4 Tensor Core GPU,这台服务器运行Ubuntu Server 22.04 LTS

Amazon EC2 G4dn 实例专用于加速机器学习推理和图形密集型工作负载,它搭载的T4 Tensor Core GPU有16GB的显存,非常适合中等负荷下的AI场景。本次我使用的是最经济的g4dn.xlarge。你自己也可以组装在你的个人电脑(需要Nvidia消费级显卡)上正常复现安装流程。

安装驱动

检查环境

输入uname -acat /etc/lsb-release进行操作系统检查,我们看到正在运行的是Ubuntu Server 22.04.3 LTS(内核为专为AWS云上环境优化后的Linux 6.2)。

安装依赖项

我们先安装一些依赖项,比如gcc,g++,make

我们执行:sudo apt update -y && sudo apt upgrade -y && sudo apt install vim gcc g++ make python3-pip -y

查询可用的Nvidia软件版本

我们可以运行nvidia-detectorubuntu-drivers devices查看可以使用的驱动版本。如果上述的2条命令找不到,可以输入sudo apt install ubuntu-drivers-common进行安装。

然后使用sudo apt install nvidia-driver-535 -y安装最新的535版本驱动(你可以安装nvidia-driver-535-server版本)

安装完成后需要重启服务器,我们直接sudo reboot就好

检测驱动安装

重启后,我们运行nvidia-smicat /proc/driver/nvidia/version进行检查。我们可以看到535版本的驱动安装好了

参考

相关推荐
IT_陈寒2 小时前
Redis持久化这个坑,我爬了一整天才出来
前端·人工智能·后端
无风听海2 小时前
多租户系统中的 OIDC:Discovery 端点与联合登录的深度实践
后端·python·flask
小小前端仔LC3 小时前
Node.js + LangChain + React:搭建个人知识库(六)- “吃什么”项目实战:从700+菜谱入库到Taro H5端JSON渲染
前端·后端
程序员黑豆3 小时前
AI全栈开发之Java:怎么配置Java环境变量
前端·后端·ai编程
苍何4 小时前
一手实测 Claude Fable 5,手搓了个 Obsidian 的 Codex 插件
后端
swipe4 小时前
做多轮对话 Agent,为什么我建议把短期记忆放到 Redis
后端·面试·llm
程序员黑豆5 小时前
AI全栈开发之Java:什么是JDK
前端·后端·ai编程
阿明在折腾5 小时前
从Canvas到AI模型:我在线工具站里的图片处理实战
前端·后端
tyung5 小时前
Go 手写 Wait-Free SPSC 无界队列:无 CAS、无锁、泛型节点池
数据结构·后端·go
Lucien3235 小时前
学完 Spring Boot 再看 FastAPI,我破防了
后端