ysu-527科研服务器使用指南

一、网络

  1. 将联网工具复制到自己的用户目录
    cp -R /tools ~/

  2. 配置联网工具

    新建文件:nano ~/.config/yauth.conf

    将以下内容复制进文件中:

    conf 复制代码
    [USER]
    username=20******
    password=*****
    
    [SERV]
    OFFLINE_ALL=False

    将用户名密码修改为自己的用户名密码

    ctrl + x

    输入y

    再按回车保存

  3. 联网

    进入联网工具目录:cd tools

    查看使用说明:cat README.md

    一般情况下使用如下命令联网:./yauth -i0 -l

    复制代码
    yangn0@527-17-Super-Server:~/tools$ ./yauth -i0 -l
    Login successfully.

二、软件安装

https://zhuanlan.zhihu.com/p/1908296804832879701

  • 一个基本原则:

    大家都需要用的工具就"为所有用户安装",比如curl​​,tmux​。这些软件需要找具有sudo权限的服务器管理员安装。但涉及到个人环境配置,就让用户自己安装,而不是使用apt安装,比如cuda​。

  • 关于conda:

    目前的方案是每个人都自己安装conda到自己的用户目录。

  • 关于cuda:

    在深度学习环境中,cuda​是不同用户不一定用同一个版本的,管理员不可以给全部用户安装一个cudatookit包。有些网站教大家到官网下载cudatoolkit包,使用sudo安装后,在/etc/bash.bashrc​文件中添加环境变量。这样的方法会让大家执行nvcc命令时,找到是同一个cuda,而不是他们各自应该使用的cuda版本。更重要的是,cuda应该是在conda虚拟环境下管理的,可以创建conda虚拟环境后,在里面使用conda install​或者pip install​安装,而不是由管理员操心。如果有特殊需求,就请同学自己不使用sudo权限地安装在他们自己的home目录下,在他们自己的.bashrc​引入环境变量,不影响其他人。

    另外有些同学想要sudo权限使用apt安装什么包,查清楚conda命令能不能安装,搞深度学习conda基本都能管理大多数的包,包括cuda、nvcc等。但如果涉及显卡驱动,这确实需要管理员这边保持最新。

深度学习环境

深度学习环境看上去特别麻烦,什么显卡驱动,cuda,cudnn,然而我的经验是,只需要:

(需要管理员)保持显卡驱动最新。由管理员同学管理。

(其他同学)在虚拟环境内根据pytorch官方教程安装pytorch,在conda虚拟环境中自行管理cuda,nvcc这类包就行

相关推荐
CHHC18802 分钟前
NetCore树莓派桌面应用程序
linux·运维·服务器
帮我吧智能服务平台1 小时前
装备制造智能制造升级:远程运维与智能服务如何保障产线OEE
运维·服务器·制造
w6100104661 小时前
cka-2026-cri-dockerd
运维·k8s·cka
云栖梦泽1 小时前
Linux内核与驱动:9.Linux 驱动 API 封装
linux·c++
卤炖阑尾炎2 小时前
PostgreSQL 日常运维全指南:从基础操作到备份恢复
运维·数据库·postgresql
handsomestWei2 小时前
Docker引擎API接入配置
运维·http·docker·容器·api
si莉亚2 小时前
ROS2安装EVO工具包
linux·开发语言·c++·开源
Tingjct2 小时前
Linux常用指令
linux·运维·服务器
广州灵眸科技有限公司3 小时前
为RK3588注入澎湃算力:RK1820 AI加速卡完整适配与评测指南
linux·网络·人工智能·物联网·算法
daad7773 小时前
wifi_note
运维·服务器·数据库