回归(maskrcnn)

一、写在前面

虽然粉丝量很少 但是这是一个很好的平台 记录自己的历程 我看了一个很好的讲解视频 我记录一下操作过程4-maskrcnn源码修改方法哔哩哔哩bilibili 作者已经注销帐号了 但内容很好

二、maskrcnn介绍

Mask R-CNN(Mask Region-based Convolutional Neural Network)是一种用于目标检测和实例分割的深度学习模型。它是在 Faster R-CNN 的基础上扩展而来,结合了目标检测和语义分割的能力。与传统的目标检测模型相比,Mask R-CNN 不仅可以检测图像中的物体,还可以准确地分割出每个检测到的物体的像素级别的掩码。

灵活性: Mask R-CNN 是一种灵活的模型架构,可以轻松适应不同的任务和数据集。它可以用于检测和分割各种类型的物体,并且可以在不同的场景中进行有效的应用。

端到端训练: Mask R-CNN 可以进行端到端的训练,这意味着它可以同时学习目标检测和实例分割任务,而无需单独训练不同的模型。这简化了训练流程并提高了模型的效率。

三、如何做

(1)标注

下面是我标注完的结果 附上代码

复制代码
import os
import json
from PIL import Image, ImageDraw
​
# 创建新文件夹
os.makedirs('mask_images', exist_ok=True)
​
# 读取 JSON 文件
with open('plant_001.png.json', 'r') as f:
    data = json.load(f)
​
# 遍历每个形状
for idx, shape in enumerate(data['shapes']):
    label = shape['label']
    points = shape['points']
​
    # 创建新的图像
    image = Image.new('RGB', (data['imageWidth'], data['imageHeight']), (0, 0, 0))
    draw = ImageDraw.Draw(image)
​
    # 将点列表转换为元组
    xy = [(point[0], point[1]) for point in points]
​
    # 绘制多边形
    draw.polygon(xy, fill=(0, 245, 0))
​
    # 保存掩码图
    image.save(os.path.join('mask_images', label + '_mask_' + str(idx) + '.png'))
​

(2)训练 源码在这下载 Releases · matterport/Mask_RCNN (github.com)

需要对源码进行一定的修改

相关推荐
tedcloud12332 分钟前
UI-TARS-desktop部署教程:构建AI桌面自动化系统
服务器·前端·人工智能·ui·自动化·github
曦月逸霜3 小时前
啥是RAG 它能干什么?
人工智能·python·机器学习
AI医影跨模态组学3 小时前
Lancet Digit Health(IF=24.1)广东省人民医院刘再毅&南方医科大学南方医院梁莉等团队:基于可解释深度学习模型预测胶质瘤分子改变
人工智能·深度学习·论文·医学·医学影像·影像组学
应用市场3 小时前
AI 编程助手三强争霸(2026 版):Claude、Gemini、GPT 各自擅长什么?
人工智能·gpt
AC赳赳老秦4 小时前
供应链专员提效:OpenClaw自动跟踪物流信息、更新库存数据,异常自动提醒
java·大数据·服务器·数据库·人工智能·自动化·openclaw
脑极体4 小时前
从Token消耗到DAA增长,AI价值标尺正在重构
人工智能·重构
csdn小瓯4 小时前
LangGraph自适应工作流路由机制:从关键词匹配到智能决策的完整实现
人工智能·fastapi·langgraph
QYR-分析4 小时前
高功率飞秒激光器行业发展现状、市场机遇及未来趋势分析
大数据·人工智能
AI医影跨模态组学4 小时前
J Clin Oncol(IF=43.4)美国Cedars-Sinai医学中心等团队:基于计算组织学人工智能的晚期胰腺癌化疗选择预测性生物标志物的开发与验证
人工智能·机器学习·论文·医学·医学影像·影像组学
冬奇Lab5 小时前
RAG 系列(十六):Graph RAG——用知识图谱解决多跳关系问题
人工智能·llm