服务器双卡5090 配置深度学习环境

主要记录一下安装过程,后面会不断的更新

文章目录


安装过程

1、验证

验证:运行 nvidia-smi,确认驱动版本和两块RTX 5090都已正确识别。

需要注意,驱动版本大于一定的版本

2、安装cuda

下载安装:从NVIDIA CUDA Toolkit下载 下载地址

  • 从这里面下载合适你的就可以,我们通常说安装CUDA 就是安装CUDA Toolkit
  • 注意:在安装界面,务必用空格键取消选中 X Driver 选项,仅安装CUDA Toolkit(如果你的系统满足驱动版本)。
bash 复制代码
CUDA Installer
[ ] Driver
[X] CUDA Toolkit 12.4
[X] CUDA Demo Suite 12.4
[X] CUDA Documentation 12.4
Options
Install
↓

安装好cuda以后,需要把路径写到全局路径当中

bash 复制代码
echo 'export PATH=/usr/local/cuda-12.8/bin:$PATH' >> ~/.bashrc
echo 'export LD_LIBRARY_PATH=/usr/local/cuda-12.8/lib64:$LD_LIBRARY_PATH' >> ~/.bashrc
source ~/.bashrc

2、安装minconda

bash 复制代码
# 下载并安装 Miniconda
wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh
bash Miniconda3-latest-Linux-x86_64.sh
# 按照提示安装,选择 yes 添加到 PATH
source ~/.bashrc(安装 Miniconda 时,安装程序会自动在你的 ~/.bashrc 文件末尾添加几行配置)

3、关于CUDANN

  1. 当你通过 pip install torch(包括指定 --index-url 的 CUDA 版本)安装 PyTorch时,安装包里面已经内置了预编译好的 cuDNN 库。换句话说:PyTorch 不依赖系统全局安装的 cuDNN,它自己"打包"了一份。所以即使你不手动安装 cuDNN,torch.backends.cudnn.version() 仍然能正常工作。

4、环境导入

以其版本,比如readme里面的环境都比较老了,导入肯定会报错,建议直接第一步 pip install torch 剩下的环境缺啥补啥

相关推荐
饼干哥哥3 天前
开源Skills|搭建亚马逊动态关键词库系统,每天抓SSS级机会词
人工智能·深度学习·数据分析
乘云数字DATABUFF4 天前
5分钟部署开源APM Databuff:OpenTelemetry全链路追踪入门实战
运维·后端
武子康5 天前
调查研究-191 SenseVoice 不只是 ASR:把语音从“转文字“升级成“理解状态“
人工智能·深度学习·openai
荣--5 天前
一键部署不是为了省时间 —— 它是把"买来的 PaaS"变成"自己的平台"的拐点
运维·zabbix·工程化·一键部署·平台化·边界设计
江华森5 天前
动手实战学 Docker — 从零到集群编排完全指南
运维
Avan_菜菜6 天前
FRP 内网穿透完整实战:从 HTTP 映射到 HTTPS 自签代理
运维·nginx·https
武子康7 天前
调查研究-189 Kronos 调研:金融 K 线基础模型,是真突破,还是量化圈的新玩具?
人工智能·深度学习·openai
SelectDB7 天前
Litefuse 开源并推出单进程轻量模式,25 秒就能跑起来的 Agent 可观测与评估平台
运维·后端·自动化运维
zzzzzz3109 天前
9K Star 炸裂开源!这个 C 语言写的代码知识图谱,把 Linux 内核索引压缩到了 3 分钟
linux·服务器·sql
XIAOHEZIcode9 天前
Linux系统鼠标偏移常见原因以及修复方案
linux·运维·游戏