服务器双卡5090 配置深度学习环境

主要记录一下安装过程,后面会不断的更新

文章目录


安装过程

1、验证

验证:运行 nvidia-smi,确认驱动版本和两块RTX 5090都已正确识别。

需要注意,驱动版本大于一定的版本

2、安装cuda

下载安装:从NVIDIA CUDA Toolkit下载 下载地址

  • 从这里面下载合适你的就可以,我们通常说安装CUDA 就是安装CUDA Toolkit
  • 注意:在安装界面,务必用空格键取消选中 [X] Driver 选项,仅安装CUDA Toolkit(如果你的系统满足驱动版本)。
bash 复制代码
CUDA Installer
[ ] Driver
[X] CUDA Toolkit 12.4
[X] CUDA Demo Suite 12.4
[X] CUDA Documentation 12.4
Options
Install
↓

安装好cuda以后,需要把路径写到全局路径当中

bash 复制代码
echo 'export PATH=/usr/local/cuda-12.8/bin:$PATH' >> ~/.bashrc
echo 'export LD_LIBRARY_PATH=/usr/local/cuda-12.8/lib64:$LD_LIBRARY_PATH' >> ~/.bashrc
source ~/.bashrc

2、安装minconda

bash 复制代码
# 下载并安装 Miniconda
wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh
bash Miniconda3-latest-Linux-x86_64.sh
# 按照提示安装,选择 yes 添加到 PATH
source ~/.bashrc(安装 Miniconda 时,安装程序会自动在你的 ~/.bashrc 文件末尾添加几行配置)

3、关于CUDANN

  1. 当你通过 pip install torch(包括指定 --index-url 的 CUDA 版本)安装 PyTorch时,安装包里面已经内置了预编译好的 cuDNN 库。换句话说:PyTorch 不依赖系统全局安装的 cuDNN,它自己"打包"了一份。所以即使你不手动安装 cuDNN,torch.backends.cudnn.version() 仍然能正常工作。

4、环境导入

以其版本,比如readme里面的环境都比较老了,导入肯定会报错,建议直接第一步 pip install torch 剩下的环境缺啥补啥

相关推荐
HelloWorld工程师3 分钟前
SSL证书在哪里可以免费且快速申请?
服务器·网络协议·ssl
号码认证服务1 小时前
如何让经销商接电话时看到“XX集团”?申请号码认证统一上线
服务器·经验分享·sql·华为·智能手机·华为云·云计算
MediaTea1 小时前
人工智能通识课:机器学习之无监督学习
人工智能·深度学习·学习·机器学习
冷小鱼1 小时前
从 Docker 到容器编排:框架选型与指令详解实战指南
运维·docker·容器·k8s·docker compose·docker swarm
nashane2 小时前
HarmonyOS 6学习:解决无限循环动画被打断后“消失“的诡异问题
运维·nginx·harmonyos 5
csg11072 小时前
智慧养殖篇(四):猪场自动化饲喂与疫病预警
运维·单片机·嵌入式硬件·物联网·自动化
一切皆是因缘际会2 小时前
2026实战:AI可解释性落地全指南
人工智能·深度学习·机器学习·架构
原来是猿2 小时前
Linux - 【理解进程组、会话与作业控制】
linux·运维·服务器
2501_945837432 小时前
OpenClaw:重新定义 AI 智能体,从对话到执行的革命
服务器
keineahnung23452 小时前
PyTorch SymNode 為何找不到方法實作?──sizes_strides_methods 動態安裝機制解析
人工智能·pytorch·python·深度学习