AutoDL 使用记录

AutoDL 使用记录

1.租用新实例

  1. 创建实例需要依次选择:计费方式 → \to → 地区 → \to → GPU型号与数量 → \to → 主机

    注意事项:

    • 主机 ID:一个吉利的机号有助于炼丹成功
    • 价格:哪个便宜选哪个
    • 最高 CUDA 版本:影响了后面的环境配置
    • 支持网盘:尽量选择支持网盘,后面传数据集会好些
  2. 镜像:

    • 基础镜像:

      方便好用,需要哪个现成的选就行

    • 我的镜像:

      选自己的镜像更是方便的很

      • 如何保存镜像:自己创建镜像的话 30GB 以下免费,超出部分每 1G 一天一分钱。

        • 入口:容器实例 → \to → 操作 → \to → 更多 → \to → 保存镜像

          哪些文件夹会保存在镜像中详见 JupyterLab 中的文件夹介绍

  3. 等待创建成功与启动

    • 浅浅的等他创建好

    • 创建好启动后即可进入 JupyterLab 进行进一步的操作

    • JupyterLab 中的操作其实很够用了

      • 左边的几个文件夹

        • /

          即根目录,实例关机数据不会丢失,可存放代码等。会随保存镜像一起保存。

        • /root/autodl-tmp

          即数据盘,速度比较快,因此可存放读写IO要求高的数据。但不会随保存镜像一起保存。在选择部署的映射路径时,文档推荐/root/autodl-tmp/project/ ,不建议使用默认的 /tmp

        • /root/autodl-fs

          即文件存储,速度一般,但是可以实现多实例间的文件同步共享,不受实例开关机和保存镜像。

2.远程连接与文件传输

  • 工具选择:

  • 申请免费授权:

    • 在下载界面右侧可以找到免费授权申请的页面

    • 直接下载1 2安装,然后邮箱登录激活即可使用,此处不在赘述:

  • SSH 连接:

    • 登录指令:容器实例 → \to → SSH 登录 → \to → 登陆指令

      • 例如在ssh -p 12345 root@region-00.aaaaacloud.com命令中, 各个参数的含义为:
    • 创建连接时如下填写即可

      • 名称:随便起
      • 协议:默认 SSH 即可
      • 主机:如上所述,填写@后的内容即可
      • 端口号:填写上述端口即可
      • 用户名:@前的,一般是 root

      • 密码:复制粘贴即可

      • 最后点击连接即可:

  • SFTP 文件传输

    • 创建连接:和上面差不多

    • 直接从本机拖过去即可:

  • 公网网盘

    • 推荐使用阿里网盘

      入口:容器实例 → \to → 快捷工具 → \to → AutoPanel → \to → 公网网盘

    • 下载的非常快啊

3.PyCharm 远程调试

注意需要使用 PyCharm 专业版

  1. 添加 SSH 解释器

    • 注意选对解释器位置
    • 注意部署文件夹的选择

    等待加载即可

  2. 配置部署

    • 添加与选择好SSH解释器后,会自动生成一个部署配置,可以在此处查看
    • 具体来说,可以配置诸如连接、映射排除等
      • 需要注意的是,不要勾选"仅对此项目可见",勾上会有问题。

      • 如果前面有了最终的映射位置是"根路径+部署路径",填重了会叠加很多文件夹。

      • 可以添加排除路径,避免同步一些没用的玩意儿

      • 此外可以在选项中设置按"Ctrl+S"时同步上传

        如此即可实现保存时上传。

  3. 至此,即可开启远程炼丹之旅了。

相关推荐
饭饭大王6664 分钟前
CANN 生态中的自动化测试利器:`test-automation` 项目保障模型部署可靠性
深度学习
island13147 分钟前
CANN HIXL 通信库深度解析:单边点对点数据传输、异步模型与异构设备间显存直接访问
人工智能·深度学习·神经网络
心疼你的一切12 分钟前
解锁CANN仓库核心能力:从零搭建AIGC轻量文本生成实战(附代码+流程图)
数据仓库·深度学习·aigc·流程图·cann
2的n次方_21 分钟前
CANN ascend-transformer-boost 深度解析:针对大模型的高性能融合算子库与算力优化机制
人工智能·深度学习·transformer
User_芊芊君子1 小时前
【分布式训练】CANN SHMEM跨设备内存通信库:构建高效多机多卡训练的关键组件
分布式·深度学习·神经网络·wpf
聆风吟º1 小时前
CANN算子开发:ops-nn神经网络算子库的技术解析与实战应用
人工智能·深度学习·神经网络·cann
觉醒大王1 小时前
强女思维:着急,是贪欲外显的相。
java·论文阅读·笔记·深度学习·学习·自然语言处理·学习方法
笔画人生1 小时前
# 探索 CANN 生态:深入解析 `ops-transformer` 项目
人工智能·深度学习·transformer
灰灰勇闯IT1 小时前
领域制胜——CANN 领域加速库(ascend-transformer-boost)的场景化优化
人工智能·深度学习·transformer
小白狮ww1 小时前
要给 OCR 装个脑子吗?DeepSeek-OCR 2 让文档不再只是扫描
人工智能·深度学习·机器学习·ocr·cpu·gpu·deepseek