下一次,我要夺回配置GPU服务器出错的时间!

最近使用主机连接GPU服务器进行代码实验,但是在环境配置上出现了一些问题,这里一一汇总并记录一下自己的解决办法,并希望以这种方式帮助到遇到相同问题的人

1.服务器conda安装及环境创建

使用wget下载conda安装包出现证书不符的问题

添加sudo和no-check-certificate使下载验证下载证书:

sudo wget 'htts://repo.anaconda.com/archive/Anaconda3-2023.09-0-Linux-x86_64.sh' --no-check-certificate

然后发现下载的只是一个html文件,泪崩了(出现这种情况的可以直接到服务器看看是不是自己账号上网没了)

然后决定使用小绿(Xftp)或vscode把文件上传到服务器上:

step1:到清华源(mirrors.tuna.tsinghua.edu.cn/anaconda/ar...)下载顺眼的版本

step2:使用小绿或vscode上传安装包

step3:安装conda,命令为:bash+你的安装包,一直连点回车下去,最后输入yes同意协议,再点一次回车,即安装到默认文件夹,输入自己文件夹即可更改路径

step4:conda -V验证conda是否安装成功

接着是创建虚拟环境:conda create -n pytorch python=3.7

这时候出现网络异常了,当时想当然地认为只是因为下载源的问题

根据清华源镜像站(anaconda | 镜像站使用帮助 | 清华大学开源软件镜像站 | Tsinghua Open Source Mirror)改下conda配置文件:

sudo vim ~/condarc

文件改为以下内容(网上部分博客会说把https改为http下载速度会变快,我的没有成功,只能在每次pip后加上源)

ruby 复制代码
channels:
  - defaults
show_channel_urls: true
default_channels:
  - https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main
  - https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/r
  - https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/msys2
custom_channels:
  conda-forge: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
  msys2: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
  bioconda: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
  menpo: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
  pytorch: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
  pytorch-lts: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
  simpleitk: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
  deepmodeling: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/

运行 conda clean -i 清除索引缓存,保证用的是镜像站提供的索引。

运行 conda create -n pytorch python=3.7尝试

发现还是没有创建成功,只会抛出未知异常并问你是否将该异常发送到网站帮助他们改进

最后,尝试去服务器看看你账户有没有网,很有可能是这个问题导致的,因为我弄了两天下载方式及换源,最后才发现是账户没网(另辟蹊径:真的没网行不行?行!运行该命令conda config --set offline true把conda配置设为离线创建环境)

2.vscode连接服务器出现连接失败问题

拿到服务后第一件事就是想用上我强大的vocode进行服务器连接,但是由于服务器网络原因,一直没有连接上,下面来看看问题的出现及解决的办法:

当使用vscode插件remote-ssh连接服务器并输入端口及密码后出现了:

Resolver error: Error: XHR failed

第一感觉可能是账号密码错误,因此使用小红(Xshell:家庭/学校免费 - NetSarang Website (xshell.com))连接服务器尝试,幸运而又不幸的是用小红打开了!!!遂使用小红加小绿(Xftp)进行服务器编程及运行代码。

开个玩笑,肯定是离不开vscode啦。回来寻找解决办法,想到可能是因为网络原因导致vscode的sever文件下载失败,所以决定进行wget进行服务器文件下载。

step1:在服务器上创建vscode的sever文件夹

mkdir -p .vscode-sever/bin/

step2:查看并保存vscode的commit版本号(vscode->菜单栏内帮助按钮->关于)

step3:服务器运行下载文件命令

wget https://update.code.visualstudio.com/commit:6c3e3dba23e8fadc360aed75ce363ba185c49794/server-linux-x64/stable

注:commit后的一个字符串需替换为step中的版本号

step4:解压文件夹

tar -zxf stable

step5:移动该文件夹到sever文件夹下的/bin/commit_id/下

mv vscode-server-linux-x64 ~/.vscode-server/bin/6c3e3dba23e8fadc360aed75ce363ba185c49794

注:commit后的一个字符串需替换为step中的版本号

到这里vscode的sever就搭建成功啦,快再使用vscode连接试试!

连接成功界面

相关推荐
大大dxy大大7 小时前
机器学习实现逻辑回归-癌症分类预测
机器学习·分类·逻辑回归
武子康7 小时前
AI研究-119 DeepSeek-OCR PyTorch FlashAttn 2.7.3 推理与部署 模型规模与资源详细分析
人工智能·深度学习·机器学习·ai·ocr·deepseek·deepseek-ocr
躲猫猫的喵喵9 小时前
Ubuntu2204降内核版本
linux·运维·服务器·ubuntu
没有钱的钱仔10 小时前
机器学习笔记
人工智能·笔记·机器学习
cccccc语言我来了10 小时前
(Linux (6):从包管理到工具探索,构建系统操作基础认知)
linux·运维·服务器
wuk99811 小时前
CentOS7环境搭建L2TP服务器
运维·服务器
恒创科技HK11 小时前
香港1核2G云服务器当网站服务器够用不?
运维·服务器
学习3人组12 小时前
Node.js 网站服务器开发
运维·服务器·node.js
来知晓12 小时前
Linux:WSL内存空间管理之清完内存C盘可用空间不增问题解决
linux·运维·服务器
DP+GISer12 小时前
基于站点数据进行遥感机器学习参数反演-以XGBOOST反演LST为例(附带数据与代码)试读
人工智能·python·机器学习·遥感与机器学习