DAMODEL丹摩|Faster-Rcnn训练与部署实战

本文仅做测评体验,非广告。

文章目录

    1. 丹摩介绍
    1. Faster-Rcnn介绍
    1. 准备
      1. 1 丹摩平台准备实例
    1. 2 Faster-Rcnn
    1. 部署开始
    1. 训练
    1. 资源释放
    1. 结语

1. 丹摩介绍

详细介绍请看:丹摩平台介绍

丹摩智算平台(DAMODEL)是专为人工智能开发者打造的高性能计算服务平台,旨在提供丰富的算力资源和基础设施,助力AI应用的开发、训练和部署。

2. Faster-Rcnn介绍

Faster-Rcnn,作为两阶段目标检测模型的佼佼者,历经时间考验,依旧在检测领域占据一席之地。

Faster R-CNN的工作流程始于利用区域建议网络(RPN)自动生成候选区域,这些区域被假定为潜在的目标位置。随后,这些候选区域连同整张图像被送入深度卷积网络。在网络的前向传播过程中,它不仅提取特征,还同时完成区域的分类与边界框的精确调整。这种设计使得Faster R-CNN在保持高效率的同时,也确保了检测的准确性,因为它避免了对每个候选区域进行重复的特征提取和分类,显著提升了检测速度。

Faster R-CNN算法的三个核心步骤如下:

  1. 对于每张输入图像,通过RPN生成大约1000至2000个候选区域。

  2. 将图像送入卷积网络以获得特征图,并将候选区域映射到这些特征图上,提取相应的特征向量。

  3. 通过ROI池化层将每个特征向量调整为统一的7x7大小的特征图,然后通过一系列全连接层进行处理,最终输出目标的分类和定位结果。

3. 准备

3. 1 丹摩平台准备实例

丹摩平台链接

  1. 创建云实例

    配置选择上,由于该模型的配置要求比较高,因此这里我选择比之前的费用略贵的NVIDIA-GeForce-RTX-4090

其他配置信息保持默认就可以,当然也可以根据经济条件或需求自行拉高。

镜像选择Pytorch2.4.0。

创建密钥对

注意下载下来的密钥文件要妥善保管,接下来需要用。

选择刚刚创建的密钥对:

配置一览:

点击立即创建,等待创建完成:

创建完成如下:

3. 2 Faster-Rcnn

下载链接

4. 部署开始

  1. 点击右侧JupyterLab进入云实例
  2. 进入终端
  3. 上传文件

    选择刚刚下载的Faster-Rcnn文件。
  4. 解压
    执行:
bash 复制代码
unzip mmdetection-3.3.0.zip

如果解压失败,就说明还没有上传完成,还要再等一会。

解压成功后会出现这样的文件夹:

  1. 安装环境

安装mmcv包

bash 复制代码
pip install mmcv==2.1.0 -f https://download.openmmlab.com/mmcv/dist/cu121/torch2.1/index.html -i https://mirrors.aliyun.com/pypi/simple/ --root-user-action=ignore

从源码安装mmdetection-3.3.0

bash 复制代码
cd mmdetection-3.3.0
pip install -r requirements/build.txt -i https://pypi.tuna.tsinghua.edu.cn/simple/ --root-user-action=ignore
pip install -v -e ./ -i https://pypi.tuna.tsinghua.edu.cn/simple/ --root-user-action=ignore 

安装必要包

bash 复制代码
pip install numpy==1.24.4 -i https://pypi.tuna.tsinghua.edu.cn/simple/ --root-user-action=ignore
pip install setuptools==69.5.1 -i https://pypi.tuna.tsinghua.edu.cn/simple/ --root-user-action=ignore
pip install instaboostfast -i https://pypi.tuna.tsinghua.edu.cn/simple/ --root-user-action=ignore

安装全景分割依赖panopticapi

bash 复制代码
cd panopticapi
pip install -e . -i https://pypi.tuna.tsinghua.edu.cn/simple/ --root-user-action=ignore
cd ..

安装 LVIS 数据集依赖

bash 复制代码
cd lvis-api
pip install -e . -i https://pypi.tuna.tsinghua.edu.cn/simple/ --root-user-action=ignore
cd ..

安装 albumentations 依赖

bash 复制代码
pip install -r requirements/albu.txt -i https://pypi.tuna.tsinghua.edu.cn/simple/ --root-user-action=ignore
pip install mmengine -i https://pypi.tuna.tsinghua.edu.cn/simple/ --root-user-action=ignore

依次执行就可以。

安装过程均发生在云端,不会占用本地带宽和空间。

5. 训练

  1. 开始训练
bash 复制代码
python ./tools/train.py ./checkpoints/faster-rcnn_r50_fpn_1x_coco.py

输入该指令后,就会自动开始下载与训练的过程。

  1. 保存数据
bash 复制代码
python tools/test.py ./checkpoints/faster-rcnn_r50_fpn_1x_coco.py ./checkpoints/faster_rcnn_r50_fpn_1x_coco_20200130-047c8118.pth --show-dir /root/workspace/mmdetection-3.3.0/result/

这样训练结果就会被保存在result文件夹。

  1. 导出数据
    执行
bash 复制代码
tar -czvf result.tar.gz result/

在左侧找到压缩文件,右键下载:

然后在windows中使用压缩软件打开就可以了。

5. 资源释放

如果没有继续使用该云实例的打算,回到丹摩平台,释放资源避免产生扣费

6. 结语

在本教程中,我们不仅训练了经典经典目标检测模型Faster-Rcnn,还体验了丹摩平台的便捷性和高效性。

丹摩平台以其用户友好的界面、灵活的资源配置和即开即用的便捷性,为用户提供了一个理想的AI开发和部署环境。

谢谢你的阅读,喜欢的话来个点赞收藏评论关注吧!
我会持续更新更多优质文章

相关推荐
深圳市青牛科技实业有限公司 小芋圆2 小时前
GC8872 是一款带故障报告功能的刷式直流电机驱动芯片, 适用于打印机、电器、工业设备以及其他小型机器。
人工智能·科技·stm32·单片机·嵌入式硬件·机器人
子午3 小时前
基于Python深度学习【眼疾识别】系统设计与实现+人工智能+机器学习+TensorFlow算法
人工智能·python·深度学习
云天徽上4 小时前
【数据可视化-11】全国大学数据可视化分析
人工智能·机器学习·信息可视化·数据挖掘·数据分析
李洋-蛟龙腾飞公司4 小时前
HarmonyOS NEXT 应用开发练习:AI智能语音播报
人工智能·harmonyos
JAMES费6 小时前
《Hands on Large Language Models》(深入浅出大型语言模型)实战书探秘
人工智能·语言模型·自然语言处理
MichaelIp6 小时前
LLM大语言模型中RAG切片阶段改进策略
人工智能·python·语言模型·自然语言处理·chatgpt·embedding·word2vec
XianxinMao6 小时前
MemGPT:赋能大型语言模型的自我记忆管理
人工智能·语言模型
酒酿小圆子~7 小时前
NLP中常见的分词算法(BPE、WordPiece、Unigram、SentencePiece)
人工智能·算法·自然语言处理
新加坡内哥谈技术8 小时前
Virgo:增强慢思考推理能力的多模态大语言模型
人工智能·语言模型·自然语言处理
martian6659 小时前
深入详解人工智能计算机视觉之图像生成与增强:生成对抗网络(GAN)
人工智能·计算机视觉