下一次,我要夺回配置GPU服务器出错的时间!

最近使用主机连接GPU服务器进行代码实验,但是在环境配置上出现了一些问题,这里一一汇总并记录一下自己的解决办法,并希望以这种方式帮助到遇到相同问题的人

1.服务器conda安装及环境创建

使用wget下载conda安装包出现证书不符的问题

添加sudo和no-check-certificate使下载验证下载证书:

sudo wget 'htts://repo.anaconda.com/archive/Anaconda3-2023.09-0-Linux-x86_64.sh' --no-check-certificate

然后发现下载的只是一个html文件,泪崩了(出现这种情况的可以直接到服务器看看是不是自己账号上网没了)

然后决定使用小绿(Xftp)或vscode把文件上传到服务器上:

step1:到清华源(mirrors.tuna.tsinghua.edu.cn/anaconda/ar...)下载顺眼的版本

step2:使用小绿或vscode上传安装包

step3:安装conda,命令为:bash+你的安装包,一直连点回车下去,最后输入yes同意协议,再点一次回车,即安装到默认文件夹,输入自己文件夹即可更改路径

step4:conda -V验证conda是否安装成功

接着是创建虚拟环境:conda create -n pytorch python=3.7

这时候出现网络异常了,当时想当然地认为只是因为下载源的问题

根据清华源镜像站(anaconda | 镜像站使用帮助 | 清华大学开源软件镜像站 | Tsinghua Open Source Mirror)改下conda配置文件:

sudo vim ~/condarc

文件改为以下内容(网上部分博客会说把https改为http下载速度会变快,我的没有成功,只能在每次pip后加上源)

ruby 复制代码
channels:
  - defaults
show_channel_urls: true
default_channels:
  - https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main
  - https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/r
  - https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/msys2
custom_channels:
  conda-forge: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
  msys2: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
  bioconda: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
  menpo: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
  pytorch: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
  pytorch-lts: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
  simpleitk: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
  deepmodeling: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/

运行 conda clean -i 清除索引缓存,保证用的是镜像站提供的索引。

运行 conda create -n pytorch python=3.7尝试

发现还是没有创建成功,只会抛出未知异常并问你是否将该异常发送到网站帮助他们改进

最后,尝试去服务器看看你账户有没有网,很有可能是这个问题导致的,因为我弄了两天下载方式及换源,最后才发现是账户没网(另辟蹊径:真的没网行不行?行!运行该命令conda config --set offline true把conda配置设为离线创建环境)

2.vscode连接服务器出现连接失败问题

拿到服务后第一件事就是想用上我强大的vocode进行服务器连接,但是由于服务器网络原因,一直没有连接上,下面来看看问题的出现及解决的办法:

当使用vscode插件remote-ssh连接服务器并输入端口及密码后出现了:

Resolver error: Error: XHR failed

第一感觉可能是账号密码错误,因此使用小红(Xshell:家庭/学校免费 - NetSarang Website (xshell.com))连接服务器尝试,幸运而又不幸的是用小红打开了!!!遂使用小红加小绿(Xftp)进行服务器编程及运行代码。

开个玩笑,肯定是离不开vscode啦。回来寻找解决办法,想到可能是因为网络原因导致vscode的sever文件下载失败,所以决定进行wget进行服务器文件下载。

step1:在服务器上创建vscode的sever文件夹

mkdir -p .vscode-sever/bin/

step2:查看并保存vscode的commit版本号(vscode->菜单栏内帮助按钮->关于)

step3:服务器运行下载文件命令

wget https://update.code.visualstudio.com/commit:6c3e3dba23e8fadc360aed75ce363ba185c49794/server-linux-x64/stable

注:commit后的一个字符串需替换为step中的版本号

step4:解压文件夹

tar -zxf stable

step5:移动该文件夹到sever文件夹下的/bin/commit_id/下

mv vscode-server-linux-x64 ~/.vscode-server/bin/6c3e3dba23e8fadc360aed75ce363ba185c49794

注:commit后的一个字符串需替换为step中的版本号

到这里vscode的sever就搭建成功啦,快再使用vscode连接试试!

连接成功界面

相关推荐
yeyuningzi13 分钟前
Debian 12环境里部署nginx步骤记录
linux·运维·服务器
EasyCVR1 小时前
萤石设备视频接入平台EasyCVR多品牌摄像机视频平台海康ehome平台(ISUP)接入EasyCVR不在线如何排查?
运维·服务器·网络·人工智能·ffmpeg·音视频
西柚小萌新1 小时前
8.机器学习--决策树
人工智能·决策树·机器学习
龙哥说跨境3 小时前
如何利用指纹浏览器爬虫绕过Cloudflare的防护?
服务器·网络·python·网络爬虫
pk_xz1234564 小时前
Shell 脚本中变量和字符串的入门介绍
linux·运维·服务器
小珑也要变强4 小时前
Linux之sed命令详解
linux·运维·服务器
海绵波波1074 小时前
Webserver(4.3)TCP通信实现
服务器·网络·tcp/ip
九河云6 小时前
AWS账号注册费用详解:新用户是否需要付费?
服务器·云计算·aws
Lary_Rock6 小时前
RK3576 LINUX RKNN SDK 测试
linux·运维·服务器
幺零九零零7 小时前
【计算机网络】TCP协议面试常考(一)
服务器·tcp/ip·计算机网络