下一次,我要夺回配置GPU服务器出错的时间!

最近使用主机连接GPU服务器进行代码实验,但是在环境配置上出现了一些问题,这里一一汇总并记录一下自己的解决办法,并希望以这种方式帮助到遇到相同问题的人

1.服务器conda安装及环境创建

使用wget下载conda安装包出现证书不符的问题

添加sudo和no-check-certificate使下载验证下载证书:

sudo wget 'htts://repo.anaconda.com/archive/Anaconda3-2023.09-0-Linux-x86_64.sh' --no-check-certificate

然后发现下载的只是一个html文件,泪崩了(出现这种情况的可以直接到服务器看看是不是自己账号上网没了)

然后决定使用小绿(Xftp)或vscode把文件上传到服务器上:

step1:到清华源(mirrors.tuna.tsinghua.edu.cn/anaconda/ar...)下载顺眼的版本

step2:使用小绿或vscode上传安装包

step3:安装conda,命令为:bash+你的安装包,一直连点回车下去,最后输入yes同意协议,再点一次回车,即安装到默认文件夹,输入自己文件夹即可更改路径

step4:conda -V验证conda是否安装成功

接着是创建虚拟环境:conda create -n pytorch python=3.7

这时候出现网络异常了,当时想当然地认为只是因为下载源的问题

根据清华源镜像站(anaconda | 镜像站使用帮助 | 清华大学开源软件镜像站 | Tsinghua Open Source Mirror)改下conda配置文件:

sudo vim ~/condarc

文件改为以下内容(网上部分博客会说把https改为http下载速度会变快,我的没有成功,只能在每次pip后加上源)

ruby 复制代码
channels:
  - defaults
show_channel_urls: true
default_channels:
  - https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main
  - https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/r
  - https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/msys2
custom_channels:
  conda-forge: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
  msys2: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
  bioconda: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
  menpo: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
  pytorch: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
  pytorch-lts: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
  simpleitk: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
  deepmodeling: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/

运行 conda clean -i 清除索引缓存,保证用的是镜像站提供的索引。

运行 conda create -n pytorch python=3.7尝试

发现还是没有创建成功,只会抛出未知异常并问你是否将该异常发送到网站帮助他们改进

最后,尝试去服务器看看你账户有没有网,很有可能是这个问题导致的,因为我弄了两天下载方式及换源,最后才发现是账户没网(另辟蹊径:真的没网行不行?行!运行该命令conda config --set offline true把conda配置设为离线创建环境)

2.vscode连接服务器出现连接失败问题

拿到服务后第一件事就是想用上我强大的vocode进行服务器连接,但是由于服务器网络原因,一直没有连接上,下面来看看问题的出现及解决的办法:

当使用vscode插件remote-ssh连接服务器并输入端口及密码后出现了:

Resolver error: Error: XHR failed

第一感觉可能是账号密码错误,因此使用小红(Xshell:家庭/学校免费 - NetSarang Website (xshell.com))连接服务器尝试,幸运而又不幸的是用小红打开了!!!遂使用小红加小绿(Xftp)进行服务器编程及运行代码。

开个玩笑,肯定是离不开vscode啦。回来寻找解决办法,想到可能是因为网络原因导致vscode的sever文件下载失败,所以决定进行wget进行服务器文件下载。

step1:在服务器上创建vscode的sever文件夹

mkdir -p .vscode-sever/bin/

step2:查看并保存vscode的commit版本号(vscode->菜单栏内帮助按钮->关于)

step3:服务器运行下载文件命令

wget https://update.code.visualstudio.com/commit:6c3e3dba23e8fadc360aed75ce363ba185c49794/server-linux-x64/stable

注:commit后的一个字符串需替换为step中的版本号

step4:解压文件夹

tar -zxf stable

step5:移动该文件夹到sever文件夹下的/bin/commit_id/下

mv vscode-server-linux-x64 ~/.vscode-server/bin/6c3e3dba23e8fadc360aed75ce363ba185c49794

注:commit后的一个字符串需替换为step中的版本号

到这里vscode的sever就搭建成功啦,快再使用vscode连接试试!

连接成功界面

相关推荐
TG:@yunlaoda360 云老大12 分钟前
华为云国际站代理商NAT的规格有哪些?
服务器·网络·华为云
Guheyunyi29 分钟前
视频安全监测系统的三大核心突破
大数据·运维·服务器·人工智能·安全·音视频
Xの哲學40 分钟前
Linux UPnP技术深度解析: 从设计哲学到实现细节
linux·服务器·网络·算法·边缘计算
柏木乃一44 分钟前
进程(6)进程切换,Linux中的进程组织,Linux进程调度算法
linux·服务器·c++·算法·架构·操作系统
Run_Teenage1 小时前
Linux:进程等待
linux·运维·服务器
nnerddboy1 小时前
解决传统特征波段选择的不可解释性:2. SHAP和LIME
python·机器学习
春日见1 小时前
眼在手上外参标定保姆级教学(vscode + opencv)
linux·运维·服务器·数码相机·opencv·ubuntu·3d
ekprada2 小时前
Day 47 - 注意力热力图 (Attention Heatmap)
人工智能·机器学习
Yeats_Liao2 小时前
MindSpore开发之路(八):数据处理之Dataset(上)——构建高效的数据流水线
数据结构·人工智能·python·机器学习·华为
TracyGC2 小时前
Linux环境-RTX5080显卡CUDA12.8下安装mmcv/mmdetection3d
linux·运维·服务器