服务器机器学习环境搭建(包括AanConda的安装和Pytorch的安装)

服务器机器学习环境搭建

1 服务器与用户

在学校中,我们在学校中是以用户的身份进行访问学校的服务器的。整体框架大致如下:

我们与root用户共享服务器的一些资源,比如显卡驱动,Cuda以及一些其他的公共软件。

一般情况下,只有root用户,才有权力管理公共资源。比如Cuda的安装,更新等等。

普通用户可以进行使用这些公共资源。

其中公共资源当中,有些资源比如Conda的版本和Python的版本与自己所需要的版本不一致的话,就需要自己重新去安装符合自己版本的Conda和Python版本。

2 申请账号

root管理员账户可以添加用户。创建成功后,可以有自己对应的文件夹,用户在自己对应的文件夹中进行操作。

root添加账号操作的命令: useradd newuser

3 用户连接终端SSH命令

通过SSH可以连接到远程终端,然后就可以在远程服务器上进行对应的操作。

命令:

bash 复制代码
ssh username@服务器ip地址

4 linux安装配置环境

一般来说,现在都是使用Anaconda来进行配置机器学习的实验环境。

4.1安装AnaConda

Anaconda 简介:

Anaconda(官方网站)就是可以便捷获取包且对包能够进行管理,同时对环境可以统一管理的发行版本。Anaconda包含了conda、Python在内的超过180个科学包及其依赖项。

因为我们可能不仅仅只是需要跑一个实验,不同实验的对于第三方库要求可能不一样,比如有些需要Pytorch,有些不需要,有些需要Pytorch比较新的版本,有些论文又比较旧,如果只有一个环境的话,就需要卸载重装。而Anaconda可以根据需要配置不同的环境。

4.1.1 下载anaconda的安装包

这里我们需要在官网上查找自己需要的版本,地址链接在下面:

https://repo.anaconda.com/archive/

这里以我自己安装的版本为例:

https://repo.anaconda.com/archive/Anaconda3-2024.02-1-Linux-x86_64.sh

这是我选择的版本,然后我们在控制台输入这句话:

wget https://repo.anaconda.com/archive/Anaconda3-2024.02-1-Linux-x86_64.sh

下载完正常显示为:

如果没有问题,报错,就可以进行下一步4.1.2操作。

4.1.2 安装anaconda的安装包
  1. 设置文件权限:下载完成后,你需要给下载的文件添加可执行权限。你可以使用下面的命令来改变文件权限:
bash 复制代码
   chmod +x Anaconda3-2024.02-1-Linux-x86_64.sh

​ 2.运行安装程序:然后,你可以运行下面的命令启动 Anaconda 的安装程序:

bash 复制代码
   bash Anaconda3-2024.02-1-Linux-x86_64.sh

按照提示进行安装

​ 一般会出现如下图:

​ **3.点击Enter键(回车键)😗*此时显示Anaconda的信息,并且会出现More,一直按Enter,直到如下图所示:

4.输入yes:出现如下界面:

5.输入Enter回车键:出现如下界面:

  1. 建议输入yes: 安装程序会询问是否将anaconda添加到PATH环境变量中。如果要在命令行中使用conda和anaconda,则建议选择此选项。

7. 重新启动shell或者使用bash命令加载配置

在安装 Anaconda 后,它会自动将相关的环境变量添加到 shell 的配置文件中(如 .bashrc.zshrc)。但是,这些环境变量只会在重新打开终端或重新加载 shell 配置后生效。

bash 复制代码
source ~/.bashrc

8.完成安装以及检测是否安装成功

打开新的终端后,进入自己的文件夹目录下,输入anaconda -V(注意a要小写,V要大写),conda -V ,显示版本信息,若显示则表示安装成功。

4.2 Anaconda 安装 Pytorch

4.2.1 创建虚拟环境
bash 复制代码
conda create -n myapp python=3.8
4.2.2 激活环境

使用下面这条命令,激活环境:

bash 复制代码
conda activate myapp
4.2.3 检测环境是否安装好:
bash 复制代码
conda info --envs

显示如下:

4.2.4 选择适合自己的pytorch版本

官方链接:

https://pytorch.org/

通过以下指令查看当前linux服务器cuda版本:

bash 复制代码
nvcc --version

在官网中找到适合自己的版本进行安装:

bash 复制代码
# CUDA 10.1
pip install torch==1.8.1+cu101 torchvision==0.9.1+cu101 torchaudio==0.8.1 -f https://download.pytorch.org/whl/torch_stable.html
4.2.5 测试是否安装成功

输入python,进入到python编辑,输入以下代码进行检测是否安装成功!

python 复制代码
import torch

# 检查PyTorch版本
print("PyTorch版本:", torch.__version__)

# 检查CUDA是否可用
print("CUDA是否可用:", torch.cuda.is_available())

测试结果为:

安装成功!

复制代码
相关推荐
艾派森25 分钟前
大数据分析案例-基于随机森林算法的智能手机价格预测模型
人工智能·python·随机森林·机器学习·数据挖掘
weixin_4426434242 分钟前
推荐FileLink数据跨网摆渡系统 — 安全、高效的数据传输解决方案
服务器·网络·安全·filelink数据摆渡系统
Karoku0661 小时前
【企业级分布式系统】Zabbix监控系统与部署安装
运维·服务器·数据库·redis·mysql·zabbix
半桶水专家1 小时前
用go实现创建WebSocket服务器
服务器·websocket·golang
1 小时前
开源竞争-数据驱动成长-11/05-大专生的思考
人工智能·笔记·学习·算法·机器学习
布值倒区什么name1 小时前
bug日常记录responded with a status of 413 (Request Entity Too Large)
运维·服务器·bug
忘梓.2 小时前
划界与分类的艺术:支持向量机(SVM)的深度解析
机器学习·支持向量机·分类
Chef_Chen2 小时前
从0开始机器学习--Day17--神经网络反向传播作业
python·神经网络·机器学习
。puppy2 小时前
HCIP--3实验- 链路聚合,VLAN间通讯,Super VLAN,MSTP,VRRPip配置,OSPF(静态路由,环回,缺省,空接口),NAT
运维·服务器
颇有几分姿色2 小时前
深入理解 Linux 内存管理:free 命令详解
linux·运维·服务器