服务器双卡5090 配置深度学习环境

主要记录一下安装过程,后面会不断的更新

文章目录


安装过程

1、验证

验证:运行 nvidia-smi,确认驱动版本和两块RTX 5090都已正确识别。

需要注意,驱动版本大于一定的版本

2、安装cuda

下载安装:从NVIDIA CUDA Toolkit下载 下载地址

  • 从这里面下载合适你的就可以,我们通常说安装CUDA 就是安装CUDA Toolkit
  • 注意:在安装界面,务必用空格键取消选中 X Driver 选项,仅安装CUDA Toolkit(如果你的系统满足驱动版本)。
bash 复制代码
CUDA Installer
[ ] Driver
[X] CUDA Toolkit 12.4
[X] CUDA Demo Suite 12.4
[X] CUDA Documentation 12.4
Options
Install
↓

安装好cuda以后,需要把路径写到全局路径当中

bash 复制代码
echo 'export PATH=/usr/local/cuda-12.8/bin:$PATH' >> ~/.bashrc
echo 'export LD_LIBRARY_PATH=/usr/local/cuda-12.8/lib64:$LD_LIBRARY_PATH' >> ~/.bashrc
source ~/.bashrc

2、安装minconda

bash 复制代码
# 下载并安装 Miniconda
wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh
bash Miniconda3-latest-Linux-x86_64.sh
# 按照提示安装,选择 yes 添加到 PATH
source ~/.bashrc(安装 Miniconda 时,安装程序会自动在你的 ~/.bashrc 文件末尾添加几行配置)

3、关于CUDANN

  1. 当你通过 pip install torch(包括指定 --index-url 的 CUDA 版本)安装 PyTorch时,安装包里面已经内置了预编译好的 cuDNN 库。换句话说:PyTorch 不依赖系统全局安装的 cuDNN,它自己"打包"了一份。所以即使你不手动安装 cuDNN,torch.backends.cudnn.version() 仍然能正常工作。

4、环境导入

以其版本,比如readme里面的环境都比较老了,导入肯定会报错,建议直接第一步 pip install torch 剩下的环境缺啥补啥

相关推荐
快乐肚皮18 小时前
【无标题】
服务器·网络·tcp/ip
似水এ᭄往昔18 小时前
【Linux系统编程】--进程概念
linux·运维·服务器
Dxy123931021618 小时前
Linux 如何关闭关不掉的进程
linux·运维·chrome
小徐敲java18 小时前
Linux读取串口实时数据
linux·运维·服务器
手写码匠19 小时前
手写 DeepSeek 推理引擎优化:从 FP16 到 INT4 的量化加速实战
人工智能·深度学习·算法·aigc
辰_砂19 小时前
国产服务器操作系统编译nginx生成rpm包
运维·nginx
zhangfeng113319 小时前
车载gpu 飞地 只保存密钥 不保存 权重 Orin确实有TEE安全飞地(TSEC/OP-TEE)
服务器·网络·人工智能·安全·transformer·芯片
YOLO数据集集合19 小时前
配电站智能运维|变电一次设备识别|高压电气构件目标检测数据集|电力巡检
运维·人工智能·深度学习·yolo·目标检测·视觉检测
keyipatience19 小时前
25.Linux静态动态库全解析
linux·运维·服务器
weixin_5206498719 小时前
通信与TCP核心知识
服务器·网络·tcp/ip