下一次,我要夺回配置GPU服务器出错的时间!

最近使用主机连接GPU服务器进行代码实验,但是在环境配置上出现了一些问题,这里一一汇总并记录一下自己的解决办法,并希望以这种方式帮助到遇到相同问题的人

1.服务器conda安装及环境创建

使用wget下载conda安装包出现证书不符的问题

添加sudo和no-check-certificate使下载验证下载证书:

sudo wget 'htts://repo.anaconda.com/archive/Anaconda3-2023.09-0-Linux-x86_64.sh' --no-check-certificate

然后发现下载的只是一个html文件,泪崩了(出现这种情况的可以直接到服务器看看是不是自己账号上网没了)

然后决定使用小绿(Xftp)或vscode把文件上传到服务器上:

step1:到清华源(mirrors.tuna.tsinghua.edu.cn/anaconda/ar...)下载顺眼的版本

step2:使用小绿或vscode上传安装包

step3:安装conda,命令为:bash+你的安装包,一直连点回车下去,最后输入yes同意协议,再点一次回车,即安装到默认文件夹,输入自己文件夹即可更改路径

step4:conda -V验证conda是否安装成功

接着是创建虚拟环境:conda create -n pytorch python=3.7

这时候出现网络异常了,当时想当然地认为只是因为下载源的问题

根据清华源镜像站(anaconda | 镜像站使用帮助 | 清华大学开源软件镜像站 | Tsinghua Open Source Mirror)改下conda配置文件:

sudo vim ~/condarc

文件改为以下内容(网上部分博客会说把https改为http下载速度会变快,我的没有成功,只能在每次pip后加上源)

ruby 复制代码
channels:
  - defaults
show_channel_urls: true
default_channels:
  - https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main
  - https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/r
  - https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/msys2
custom_channels:
  conda-forge: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
  msys2: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
  bioconda: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
  menpo: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
  pytorch: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
  pytorch-lts: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
  simpleitk: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
  deepmodeling: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/

运行 conda clean -i 清除索引缓存,保证用的是镜像站提供的索引。

运行 conda create -n pytorch python=3.7尝试

发现还是没有创建成功,只会抛出未知异常并问你是否将该异常发送到网站帮助他们改进

最后,尝试去服务器看看你账户有没有网,很有可能是这个问题导致的,因为我弄了两天下载方式及换源,最后才发现是账户没网(另辟蹊径:真的没网行不行?行!运行该命令conda config --set offline true把conda配置设为离线创建环境)

2.vscode连接服务器出现连接失败问题

拿到服务后第一件事就是想用上我强大的vocode进行服务器连接,但是由于服务器网络原因,一直没有连接上,下面来看看问题的出现及解决的办法:

当使用vscode插件remote-ssh连接服务器并输入端口及密码后出现了:

Resolver error: Error: XHR failed

第一感觉可能是账号密码错误,因此使用小红(Xshell:家庭/学校免费 - NetSarang Website (xshell.com))连接服务器尝试,幸运而又不幸的是用小红打开了!!!遂使用小红加小绿(Xftp)进行服务器编程及运行代码。

开个玩笑,肯定是离不开vscode啦。回来寻找解决办法,想到可能是因为网络原因导致vscode的sever文件下载失败,所以决定进行wget进行服务器文件下载。

step1:在服务器上创建vscode的sever文件夹

mkdir -p .vscode-sever/bin/

step2:查看并保存vscode的commit版本号(vscode->菜单栏内帮助按钮->关于)

step3:服务器运行下载文件命令

wget https://update.code.visualstudio.com/commit:6c3e3dba23e8fadc360aed75ce363ba185c49794/server-linux-x64/stable

注:commit后的一个字符串需替换为step中的版本号

step4:解压文件夹

tar -zxf stable

step5:移动该文件夹到sever文件夹下的/bin/commit_id/下

mv vscode-server-linux-x64 ~/.vscode-server/bin/6c3e3dba23e8fadc360aed75ce363ba185c49794

注:commit后的一个字符串需替换为step中的版本号

到这里vscode的sever就搭建成功啦,快再使用vscode连接试试!

连接成功界面

相关推荐
无脑敲代码,bug漫天飞10 分钟前
COR 损失函数
人工智能·机器学习
中云DDoS CC防护蔡蔡11 分钟前
微信小程序被攻击怎么选择高防产品
服务器·网络安全·微信小程序·小程序·ddos
HPC_fac130520678161 小时前
以科学计算为切入点:剖析英伟达服务器过热难题
服务器·人工智能·深度学习·机器学习·计算机视觉·数据挖掘·gpu算力
yaoxin5211232 小时前
第二十七章 TCP 客户端 服务器通信 - 连接管理
服务器·网络·tcp/ip
sinat_384241096 小时前
使用 npm 安装 Electron 作为开发依赖
服务器
Kkooe8 小时前
GitLab|数据迁移
运维·服务器·git
老艾的AI世界9 小时前
AI翻唱神器,一键用你喜欢的歌手翻唱他人的曲目(附下载链接)
人工智能·深度学习·神经网络·机器学习·ai·ai翻唱·ai唱歌·ai歌曲
DK221519 小时前
机器学习系列----关联分析
人工智能·机器学习
虚拟网络工程师10 小时前
【网络系统管理】Centos7——配置主从mariadb服务器案例(下半部分)
运维·服务器·网络·数据库·mariadb
BLEACH-heiqiyihu10 小时前
RedHat7—Linux中kickstart自动安装脚本制作
linux·运维·服务器