一、网络
-
将联网工具复制到自己的用户目录
cp -R /tools ~/ -
配置联网工具
新建文件:
nano ~/.config/yauth.conf将以下内容复制进文件中:
conf[USER] username=20****** password=***** [SERV] OFFLINE_ALL=False将用户名密码修改为自己的用户名密码
ctrl + x
输入y
再按回车保存
-
联网
进入联网工具目录:
cd tools查看使用说明:
cat README.md一般情况下使用如下命令联网:
./yauth -i0 -lyangn0@527-17-Super-Server:~/tools$ ./yauth -i0 -l Login successfully.
二、软件安装
-
一个基本原则:
大家都需要用的工具就"为所有用户安装",比如curl,tmux。这些软件需要找具有sudo权限的服务器管理员安装。但涉及到个人环境配置,就让用户自己安装,而不是使用apt安装,比如cuda。
-
关于conda:
目前的方案是每个人都自己安装conda到自己的用户目录。
-
关于cuda:
在深度学习环境中,cuda是不同用户不一定用同一个版本的,管理员不可以给全部用户安装一个cudatookit包。有些网站教大家到官网下载cudatoolkit包,使用sudo安装后,在/etc/bash.bashrc文件中添加环境变量。这样的方法会让大家执行nvcc命令时,找到是同一个cuda,而不是他们各自应该使用的cuda版本。更重要的是,cuda应该是在conda虚拟环境下管理的,可以创建conda虚拟环境后,在里面使用conda install或者pip install安装,而不是由管理员操心。如果有特殊需求,就请同学自己不使用sudo权限地安装在他们自己的home目录下,在他们自己的.bashrc引入环境变量,不影响其他人。
另外有些同学想要sudo权限使用apt安装什么包,查清楚conda命令能不能安装,搞深度学习conda基本都能管理大多数的包,包括cuda、nvcc等。但如果涉及显卡驱动,这确实需要管理员这边保持最新。
深度学习环境
深度学习环境看上去特别麻烦,什么显卡驱动,cuda,cudnn,然而我的经验是,只需要:
(需要管理员)保持显卡驱动最新。由管理员同学管理。
(其他同学)在虚拟环境内根据pytorch官方教程安装pytorch,在conda虚拟环境中自行管理cuda,nvcc这类包就行