下一次,我要夺回配置GPU服务器出错的时间!

最近使用主机连接GPU服务器进行代码实验,但是在环境配置上出现了一些问题,这里一一汇总并记录一下自己的解决办法,并希望以这种方式帮助到遇到相同问题的人

1.服务器conda安装及环境创建

使用wget下载conda安装包出现证书不符的问题

添加sudo和no-check-certificate使下载验证下载证书:

sudo wget 'htts://repo.anaconda.com/archive/Anaconda3-2023.09-0-Linux-x86_64.sh' --no-check-certificate

然后发现下载的只是一个html文件,泪崩了(出现这种情况的可以直接到服务器看看是不是自己账号上网没了)

然后决定使用小绿(Xftp)或vscode把文件上传到服务器上:

step1:到清华源(mirrors.tuna.tsinghua.edu.cn/anaconda/ar...)下载顺眼的版本

step2:使用小绿或vscode上传安装包

step3:安装conda,命令为:bash+你的安装包,一直连点回车下去,最后输入yes同意协议,再点一次回车,即安装到默认文件夹,输入自己文件夹即可更改路径

step4:conda -V验证conda是否安装成功

接着是创建虚拟环境:conda create -n pytorch python=3.7

这时候出现网络异常了,当时想当然地认为只是因为下载源的问题

根据清华源镜像站(anaconda | 镜像站使用帮助 | 清华大学开源软件镜像站 | Tsinghua Open Source Mirror)改下conda配置文件:

sudo vim ~/condarc

文件改为以下内容(网上部分博客会说把https改为http下载速度会变快,我的没有成功,只能在每次pip后加上源)

ruby 复制代码
channels:
  - defaults
show_channel_urls: true
default_channels:
  - https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main
  - https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/r
  - https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/msys2
custom_channels:
  conda-forge: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
  msys2: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
  bioconda: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
  menpo: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
  pytorch: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
  pytorch-lts: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
  simpleitk: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
  deepmodeling: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/

运行 conda clean -i 清除索引缓存,保证用的是镜像站提供的索引。

运行 conda create -n pytorch python=3.7尝试

发现还是没有创建成功,只会抛出未知异常并问你是否将该异常发送到网站帮助他们改进

最后,尝试去服务器看看你账户有没有网,很有可能是这个问题导致的,因为我弄了两天下载方式及换源,最后才发现是账户没网(另辟蹊径:真的没网行不行?行!运行该命令conda config --set offline true把conda配置设为离线创建环境)

2.vscode连接服务器出现连接失败问题

拿到服务后第一件事就是想用上我强大的vocode进行服务器连接,但是由于服务器网络原因,一直没有连接上,下面来看看问题的出现及解决的办法:

当使用vscode插件remote-ssh连接服务器并输入端口及密码后出现了:

Resolver error: Error: XHR failed

第一感觉可能是账号密码错误,因此使用小红(Xshell:家庭/学校免费 - NetSarang Website (xshell.com))连接服务器尝试,幸运而又不幸的是用小红打开了!!!遂使用小红加小绿(Xftp)进行服务器编程及运行代码。

开个玩笑,肯定是离不开vscode啦。回来寻找解决办法,想到可能是因为网络原因导致vscode的sever文件下载失败,所以决定进行wget进行服务器文件下载。

step1:在服务器上创建vscode的sever文件夹

mkdir -p .vscode-sever/bin/

step2:查看并保存vscode的commit版本号(vscode->菜单栏内帮助按钮->关于)

step3:服务器运行下载文件命令

wget https://update.code.visualstudio.com/commit:6c3e3dba23e8fadc360aed75ce363ba185c49794/server-linux-x64/stable

注:commit后的一个字符串需替换为step中的版本号

step4:解压文件夹

tar -zxf stable

step5:移动该文件夹到sever文件夹下的/bin/commit_id/下

mv vscode-server-linux-x64 ~/.vscode-server/bin/6c3e3dba23e8fadc360aed75ce363ba185c49794

注:commit后的一个字符串需替换为step中的版本号

到这里vscode的sever就搭建成功啦,快再使用vscode连接试试!

连接成功界面

相关推荐
Zmxcl-0075 分钟前
IIS解析漏洞
服务器·数据库·microsoft
Stark、5 分钟前
【Linux】文件IO--fcntl/lseek/阻塞与非阻塞/文件偏移
linux·运维·服务器·c语言·后端
一个不秃头的 程序员2 小时前
服务器上加入SFTP------(小白篇 1)
运维·服务器
fnd_LN2 小时前
Linux文件目录 --- 复制命令CP、递归复制目录、软连接、硬链接
linux·运维·服务器
MorleyOlsen2 小时前
【Trick】解决服务器cuda报错——RuntimeError: cuDNN error: CUDNN_STATUS_NOT_INITIALIZED
运维·服务器·深度学习
周周的奇妙编程2 小时前
基于鲲鹏服务器的打砖块小游戏部署
运维·服务器
从后端到QT2 小时前
boost asio 异步服务器
服务器·网络·tcp/ip
愚者大大3 小时前
优化算法(SGD,RMSProp,Ada)
人工智能·算法·机器学习
墨水\\3 小时前
Ansible部署及基础模块
服务器·网络·ansible