将深度学习环境迁移至老旧系统| 个人学习笔记最近在做环境迁移,需要将一个包含LLM、PyTorch的深度学习环境,从一台单卡A100开发机迁移到一台拥有8卡A100的高性能服务器集群上。 源服务器:环境较新,Python3.10,CUDA13+,PyTorch2.9(预览版)。 目标服务器:硬件很强,但系统老旧(CentOS7),底层 glibc 版本仅为2.17,且没有root权限,无法安装系统级编译器(g++, cmake, rust)。 本以为简单的 pip install -r requirements.txt 就能搞定,结果不太行。