ysu-527科研服务器使用指南

一、网络

  1. 将联网工具复制到自己的用户目录
    cp -R /tools ~/

  2. 配置联网工具

    新建文件:nano ~/.config/yauth.conf

    将以下内容复制进文件中:

    conf 复制代码
    [USER]
    username=20******
    password=*****
    
    [SERV]
    OFFLINE_ALL=False

    将用户名密码修改为自己的用户名密码

    ctrl + x

    输入y

    再按回车保存

  3. 联网

    进入联网工具目录:cd tools

    查看使用说明:cat README.md

    一般情况下使用如下命令联网:./yauth -i0 -l

    复制代码
    yangn0@527-17-Super-Server:~/tools$ ./yauth -i0 -l
    Login successfully.

二、软件安装

https://zhuanlan.zhihu.com/p/1908296804832879701

  • 一个基本原则:

    大家都需要用的工具就"为所有用户安装",比如curl​​,tmux​。这些软件需要找具有sudo权限的服务器管理员安装。但涉及到个人环境配置,就让用户自己安装,而不是使用apt安装,比如cuda​。

  • 关于conda:

    目前的方案是每个人都自己安装conda到自己的用户目录。

  • 关于cuda:

    在深度学习环境中,cuda​是不同用户不一定用同一个版本的,管理员不可以给全部用户安装一个cudatookit包。有些网站教大家到官网下载cudatoolkit包,使用sudo安装后,在/etc/bash.bashrc​文件中添加环境变量。这样的方法会让大家执行nvcc命令时,找到是同一个cuda,而不是他们各自应该使用的cuda版本。更重要的是,cuda应该是在conda虚拟环境下管理的,可以创建conda虚拟环境后,在里面使用conda install​或者pip install​安装,而不是由管理员操心。如果有特殊需求,就请同学自己不使用sudo权限地安装在他们自己的home目录下,在他们自己的.bashrc​引入环境变量,不影响其他人。

    另外有些同学想要sudo权限使用apt安装什么包,查清楚conda命令能不能安装,搞深度学习conda基本都能管理大多数的包,包括cuda、nvcc等。但如果涉及显卡驱动,这确实需要管理员这边保持最新。

深度学习环境

深度学习环境看上去特别麻烦,什么显卡驱动,cuda,cudnn,然而我的经验是,只需要:

(需要管理员)保持显卡驱动最新。由管理员同学管理。

(其他同学)在虚拟环境内根据pytorch官方教程安装pytorch,在conda虚拟环境中自行管理cuda,nvcc这类包就行

相关推荐
越强越不秃13 分钟前
大模型驱动的PoC脚本自动化生成:从挑战到实践
运维·自动化·安全工程师
sulikey22 分钟前
个人Linux操作系统学习笔记4 - makefile
linux·makefile·make·构建
_童年的回忆_24 分钟前
【php】在linux下PHP安装amqp扩展
linux·开发语言·php
sxlishaobin35 分钟前
linux 自动清除日志 脚本
linux·服务器·前端
杰克逊的日记35 分钟前
K8s+GPU+大模型运维主要技术点
运维·容器·kubernetes
爱吃土豆的马铃薯ㅤㅤㅤㅤㅤㅤㅤㅤㅤ1 小时前
nginx部署教程
运维·网络·nginx
b***25111 小时前
电池组PACK自动化生产线:从电芯到成品的精密制造之路
运维·自动化·制造
云边云科技_云网融合1 小时前
AI 网关:企业 AI 时代的 “智能交通枢纽“—— 六大行业典型场景深度解析
大数据·运维·人工智能
蚰蜒螟1 小时前
走进 Linux 内核:从 touch 命令到磁盘 inode 的完整旅程
java·linux·前端
feng_you_ying_li1 小时前
liunx之可重入函数,volatite,和线程的基本介绍(1)
linux