训练CDN基础代码

文章目录

时间

从开始在平台上搭建到现在可以在平台上训练已经4天了

有GPU平台一般是autoDL平台,白嫖200元平台是:https://cloud.lanyun.net/

整体流程

1.注册平台,以蓝耘为例子

卡从好变坏依次是:4090>3090>3080

2.选择好适当的版本后,租用

一般上传数据和代码的时候用"无卡开机模式",比较省钱

配置环境,如果不需要自己配置环境的话,那么也是无卡开机模式

3.上传数据

点击共享网盘,绑定阿里云盘,用阿里云盘上传数据集,快一点

4.ssh登录pycharm专业版

注意:一定是pycharm专业版也可以使用ssh远程登录

参考链接:AutoDL使用教程:1)创建实例 2)配置环境+上传数据 3)PyCharm2021.3专业版下载安装与远程连接完整步骤 4)实时查看tensorboard曲线情况

后续pycharm可以写,在官网上面也可以直接修改,一般修改路径,运行的时候输入

python main.py --你所需要的参数,即可以直接运行。

训练细节

1.后台运行:

参考链接:https://blog.csdn.net/weixin_57070738/article/details/137378235

bash 复制代码
nohup python -u main.py > /root/lanyun-tmp/output.log 2>&1 &

2.训练完成后关机

bash 复制代码
--a ddd --b ddd --r ss && shutdown

3.训练时间

一个epoch是12min(20min)

我一共设置了90个epoch,那么就是1080min(1800分钟),那就是30h,我是下午4:30开始训练的,那么第二天的9:30就可以结束。

一个小时3元,总共花费:90元

加上配置环境:总共花费100元

小结

失误点:

1.数据集上传慢

不用其他软件,推荐用阿里云盘,如果直接用压缩包,解压命令如下:

bash 复制代码
# 压缩。如果没有zip命令,安装命令:apt-get update && apt-get install -y zip
zip -r <自定义压缩包名称>.zip <待压缩目录的路径>

# 解压。如果没有zip命令,安装命令:apt-get update && apt-get install -y unzip
unzip  <待解压压缩包名称>.zip -d <解压到哪个路径>

我的就是

python 复制代码
unzip train.zip -d /images

压缩包在:/root/lanyun-tmp

生成的就是:/root/lanyun-tmp/images

2.ssh登录

都要勾选,以及下面这个同步文件可以自己选,比如:/root/wintest

平台上一般都要选择/root,也就是根目录下,这里没有wintest文件夹都可以系统会自己创建一个wintest文件夹。

创建好了以后进入JupyterLab,等文件都传输到JupyterLab后才会出现,慢慢等,不着急,文件越多传输越慢。

pycharm专业版会提示你正在上传,上传结束后会提示你上传成功,我一开始在代码里面放置了数据集,一共15G所以才这么慢,所以代码和数据集分开,数据集用阿里云盘传输,代码上传。

3.代码的路径要设置成平台的路径

/root/lanyun-tmp/images,举一个例子

运行的时候路径也要设置成平台的路径

相关推荐
aosky5 分钟前
OmniVoice:支持 600+ 语言的零样本语音克隆 TTS 系统
人工智能·tts
无忧智库15 分钟前
数字化转型 | 全面揭秘企业经营的数字化解决方案 —— 从挑战到突破
大数据·人工智能
Circle Studio23 分钟前
AI算力发展的未来趋势
大数据·人工智能
算家云25 分钟前
OpenClaw进阶玩法:多飞书机器人部署指南
人工智能·飞书·openclaw
AI_Auto29 分钟前
【智能制造】- AI质检+MES:重构智能制造质量闭环
人工智能·重构·制造
Wild API40 分钟前
Claude 和 GPT 可以怎么搭?一个多模型调用示例讲清楚
人工智能·gpt
科研实践课堂(小绿书)1 小时前
华科/浙大团队Science子刊:光计算抛弃模拟乘法,用逻辑门跑神经网络
人工智能·深度学习·神经网络
rainy雨1 小时前
精益数据分析系统功能拆解:如何用精益数据分析解决指标虚高难题与初创期验证场景
大数据·数据库·人工智能·信息可视化·数据挖掘·数据分析·精益工程
SariHcr1231 小时前
基于医学图像分类算法研究(五)——基于上次kvasir后扩充数据集再次进行训练测试
人工智能
小陈工1 小时前
Python Web开发入门(十):数据库迁移与版本管理——让数据库变更可控可回滚
前端·数据库·人工智能·python·sql·云原生·架构