配置全新服务器深度学习一套流程

目录

1.安装anaconda

直接参考视频

总结:

1.下载anaconda安装包,尽量不下载最新的版本

2.bash 对应安装包,一直回车,yes

3.配置环境vim ~/.bashrc,把下面这段复制到其中,然后source ~/.bashrc激活,即配置完成,打开即是对应的anaconda

export PATH="/home/zhaol409100220027/zhaol409100220027/anaconda3/bin:$PATH"
# >>> conda initialize >>>
# !! Contents within this block are managed by 'conda init' !!
__conda_setup="$('/home/zhaol409100220027/zhaol409100220027/anaconda3/bin/conda' 'shell.bash' 'hook' 2> /dev/null)"
if [ $? -eq 0 ]; then
    eval "$__conda_setup"
else
    if [ -f "/home/zhaol409100220027/zhaol409100220027/anaconda3/etc/profile.d/conda.sh" ]; then
        . "/home/zhaol409100220027/zhaol409100220027/anaconda3/etc/profile.d/conda.sh"
    else
        export PATH="/home/zhaol409100220027/zhaol409100220027/anaconda3/bin:$PATH"
    fi
fi
unset __conda_setup
# <<< conda initialize <<<

2.配置cuda

参考视频

总结:

1.下载cuda 安装包

wget https://developer.download.nvidia.com/compute/cuda/11.8.0/local_installers/cuda_11.8.0_520.61.05_linux.run

2.sh xx.run accept后调整为如下图

sh cuda_11.8.0_520.61.05_linux.run

选择Options,进入CUDA Toolkit,全部不选择

进入Change Toolkit Install Path,更改地址为自己设置的文件夹

配置lib的位置,在Library install path处

返回install即可,出现如下即安装成功!不用管下面的warning

3.配置环境变量

复制下面这段到~/.bashrc文件中,注意更改为自己的cuda路径即可

# setting environment for cuda-11.8
export CUDA_HOME=/home/zhaol409100220027/zhaol409100220027/cuda-11.8
export PATH=/home/zhaol409100220027/zhaol409100220027//cuda-11.8/bin:$PATH
export LD_LIBRARY_PATH=/home/zhaol409100220027/zhaol409100220027/cuda-11.8/lib64:$LD_LIBRARY_PATH

安装后得到如下图即为完成的

3.配置cudnn

1.下载cudnn

2.tar -xf cudnn-linux-x86_64-9.3.0.75_cuda11-archive.tar.xz

3.做一些基础的操作

cp cudnn-linux-x86_64-8.6.0.163_cuda11-archive/include/cudnn*.h cuda-11.8/include/
cp -P cudnn-linux-x86_64-8.6.0.163_cuda11-archive/lib/libcudnn* cuda-11.8/lib64
chmod a+r cuda-11.8/include/cudnn*.h cuda-11.8/lib64/libcudnn*

到此cudnn即配置成功!

4.配置新的pytorch环境

1.创建新的虚拟环境conda create -n pytorch python=3.7

2.进入pytorch官网找到自己需要的对应的版本安装指令,注意这里所安装的torch的cuda版本要小于上面第二步所安装的cuda版本,比如我的是cuda-11.8,所安装的torch版本的为cu117即11.7版本

pip install torch==1.13.1+cu117 torchvision==0.14.1+cu117 torchaudio==0.13.1 --extra-index-url https://download.pytorch.org/whl/cu117

3.检查下是否配置成功

输入指令pythonimport torch,print(torch.__version__),print(torch.cuda.is_available()),如下图出现True为成功配置!

4.这里记录下torch里的一些基本的torch-geometric等安装,下载torch_scatter,torch-sparse,torch-cluster,torch-spline-conv包,这些包依赖关系非常严重,下错了就是满屏红字。可以从中下载https://pytorch-geometric.com/whl/,找到对应的torch版本,例如从上面我们可以看到我们torch版本是1.13.1+cu117,则进入对应的目录,下载对应的python版本需要的几个文件,如下图,把文件移到服务器,进行pin install +文件名即可安装

5.最终安装pip install torch_geometric

5.安装rdkit包

1.到rdkit官网下载适合自己的版本,一般下载20年或者21年的版本都可以。

2.下载好放置到一个路径中,anaconda切换至这个路径和切换到相应的环境,使用指令conda install --use-local package_name把这里的package name切换为自己刚刚下载的rdkit包的下载路径即可例如:conda install --use-local rdkit-2020.09.1.0-py37h3d1ada6_1.tar.bz2即可。

发现上面这种方法不好用,也会经常出现报错,具体原因不详,换如下方法:

1.进入anaconda安装包地址,找到你要安装的rdkit版本

2.进入以后看到对应指令,输入指令下载即可conda install cctbx202105::rdkit

6.小问题记录

1.遇到安装包时超时问题,pip install pandas -i https://pypi.tuna.tsinghua.edu.cn/simple/,利用-i指定镜像下载

相关推荐
pyliumy1 小时前
rsync 全网备份
linux·运维·服务器
ggb19991 小时前
【python的坑】vpn下,python request报错 check_hostname requires server_hostname
linux·运维·服务器
多多*2 小时前
OJ在线评测系统 登录页面开发 前端后端联调实现全栈开发
linux·服务器·前端·ubuntu·docker·前端框架
卑微的码蚁2 小时前
服务器相关问题
运维·服务器
博洋科技2 小时前
网站建设的服务器该如何选择?
运维·服务器·网站建设·保定响应式网站建设·保定h5网站建设·保定网站建设
人类群星闪耀时2 小时前
服务器管理:从零开始的服务器安装与配置指南
运维·服务器
河南宽信李工1503806 16864 小时前
测绘航空摄影专项资质在洛阳市的获取流程
服务器
学习向前冲4 小时前
AD域控服务器
运维·服务器
青柠视频云5 小时前
青柠视频云——视频丢包(卡顿、花屏、绿屏)排查
服务器·网络·音视频
hgdlip5 小时前
查看ip地址的方法有几种?探索多样方法
运维·服务器·ip地址