Mask_RCNN 环境配置及训练

目录

一、Mask_RCNN代码及权重

1、源码下载

2、权重获取

二、环境配置

1、创建虚拟环境

2、安装必要的包

三、测试环境

1、使用coco

2、使用balloon

四、测试

1、使用coco

2、使用balloon


一、Mask_RCNN代码及权重

均从github获取,以下是相关链接:

1、源码下载

matterport/Mask_RCNN: Mask R-CNN for object detection and instance segmentation on Keras and TensorFlowhttps://github.com/matterport/Mask_RCNN

2、权重获取

Releases · matterport/Mask_RCNNhttps://github.com/matterport/Mask_RCNN/releases分别获取两个权重文件(蓝框部分为测试用数据集)

二、环境配置

1、创建虚拟环境

**注意:**使用的Python版本为3.6,因为所需库的版本并不都适配新版Python

python 复制代码
conda create -n RCNN python=3.6

启动环境:

python 复制代码
conda activate RCNN

2、安装必要的包

根据以下版本要求安装所需的库

python 复制代码
numpy==1.19.5
scipy==1.2.1
pillow==8.2.0
cython==0.29.22
matplotlib==3.3.4
scikit-image==0.17.2
tensorflow==1.15.0
keras==2.2.5
opencv-python==4.3.0.38
h5py==2.10.0
imgaug
IPython[all]
pycocotools

注意: 因为在TensorFlow 1.x中,`tf.reduce_mean`的参数是`keep_dims`(带下划线),而在TensorFlow 2.x中改为`keepdims`(无下划线);`Keras==2.2.5` (与TF 1.x兼容) 而 `Keras==2.10.0` (与TF 2.x兼容)、`numpy==1.19.5` (TF 1.15兼容) 而 `numpy==1.23.5` (TF 2.x兼容)

所以版本过高、库之间版本不兼容会导致以下报错:

Traceback (most recent call last):

File "balloon.py", line 364, in <module>

train(model)

File "balloon.py", line 199, in train

layers='heads')

File "E:\machine-vision\Mask_RCNN-master\mrcnn\model.py", line 2354, in train

self.compile(learning_rate, self.config.LEARNING_MOMENTUM)

File "E:\machine-vision\Mask_RCNN-master\mrcnn\model.py", line 2173, in compile

tf.reduce_mean(layer.output, keepdims=True)

TypeError: reduce_mean() got an unexpected keyword argument 'keepdims'

三、测试环境

可以用coco数据集或balloon数据集进行测试,分别为:

1、使用coco

python 复制代码
python coco.py train --dataset=/path/to/coco/ --model=E:/machine-vision/Mask_RCNN-master/mask_rcnn_coco.h5 --download=True

数据集和权重文件位置自行调整,如不需要再下载数据,就把 --download=True 删掉或改为False

2、使用balloon

python 复制代码
python balloon.py train --dataset="E:/machine-vision/dataset/balloon_dataset/balloon" --weights="E:/machine-vision/Mask_RCNN-master/mask_rcnn_balloon.h5"

训练的权重文件会保存在log文件夹下

四、测试

1、使用coco

python 复制代码
python coco.py evaluate --dataset=/path/to/coco/ --model=last

2、使用balloon

python 复制代码
python balloon.py splash --weights="E:/machine-vision/Mask_RCNN-master/mask_rcnn_balloon.h5" --image="E:/machine-vision/dataset/balloon_dataset/balloon/train/699765866_abaad7274d_b.jpg"
相关推荐
Coder_Boy_5 小时前
技术让开发更轻松的底层矛盾
java·大数据·数据库·人工智能·深度学习
Gain_chance5 小时前
34-学习笔记尚硅谷数仓搭建-DWS层最近一日汇总表建表语句汇总
数据仓库·hive·笔记·学习·datagrip
啊森要自信5 小时前
CANN ops-cv:面向计算机视觉的 AI 硬件端高效算子库核心架构与开发逻辑
人工智能·计算机视觉·架构·cann
2401_836235866 小时前
中安未来SDK15:以AI之眼,解锁企业档案的数字化基因
人工智能·科技·深度学习·ocr·生活
njsgcs6 小时前
llm使用 AgentScope-Tuner 通过 RL 训练 FrozenLake 智能体
人工智能·深度学习
董董灿是个攻城狮6 小时前
AI 视觉连载2:灰度图
人工智能
yunfuuwqi6 小时前
OpenClaw✅真·喂饭级教程:2026年OpenClaw(原Moltbot)一键部署+接入飞书最佳实践
运维·服务器·网络·人工智能·飞书·京东云
九河云6 小时前
5秒开服,你的应用部署还卡在“加载中”吗?
大数据·人工智能·安全·机器学习·华为云
人工智能培训7 小时前
具身智能视觉、触觉、力觉、听觉等信息如何实时对齐与融合?
人工智能·深度学习·大模型·transformer·企业数字化转型·具身智能