OpenCV 将多个掩膜合并为一个

目录

一、概述

二、代码实现

2.1代码

2.2代码解析

三、实现的结果

四、注意事项

4.1代码

4.2代码解析


一、概述

近期在做yolov8的实例分割,在一张图中可以分割出多个目标,那对应的掩膜就会有多个,不想通过遍历每个掩膜再合并成一个的方式。所以通过numpy进行多个掩膜的合并。

二、代码实现

2.1代码

如果你有一个形状为 (640, 480, num) 的掩膜数据,其中 num 大于1,想要将这些掩膜合并成一个单一的掩膜,可以考虑使用逻辑运算来实现。通常,合并多个掩膜的方法取决于你希望如何组合这些掩膜,比如取并集、交集等。

以下是一种将多个掩膜合并成一个的基本方法:

python 复制代码
import numpy as np

# 假设有多个掩膜数据,每个掩膜的形状为 (640, 480)
num = 3  # 假设有3个掩膜
mask_data = np.random.randint(0, 2, size=(640, 480, num))  # 示例随机生成的掩膜数据

# 方法1:取所有掩膜的最大值
merged_mask_max = np.max(mask_data, axis=2)

# 方法2:取所有掩膜的和(当掩膜值为1或0时适用)
merged_mask_sum = np.sum(mask_data, axis=2)

# 方法3:取所有掩膜的乘积(当掩膜值为1或0时适用)
merged_mask_prod = np.prod(mask_data, axis=2)

# 方法4:取所有掩膜的逻辑或
merged_mask_or = np.any(mask_data, axis=2)

# 方法5:取所有掩膜的逻辑与
merged_mask_and = np.all(mask_data, axis=2)

# 选择其中一种合并方法,比如逻辑或
final_mask = merged_mask_or

# 显示合并后的掩膜
print(final_mask.shape)  # 输出应为 (640, 480)

2.2代码解析

在上述示例中,我展示了几种合并掩膜的方法:

  1. 使用 np.max 函数取所有掩膜的最大值,适用于掩膜值为0或1的情况。
  2. 使用 np.sum 函数取所有掩膜的和,适用于掩膜值为0或1的情况。
  3. 使用 np.prod 函数取所有掩膜的乘积,适用于掩膜值为0或1的情况。
  4. 使用 np.any 函数取所有掩膜的逻辑或,结果为真(1)如果任何一个掩膜为真。
  5. 使用 np.all 函数取所有掩膜的逻辑与,结果为真(1)如果所有掩膜都为真。

你可以根据你的具体需求选择其中一种方法来合并掩膜。这些方法基于逻辑运算来组合多个掩膜,生成一个单一的掩膜图像。

三、实现的结果

图中的mask_data是我分割出来掩膜的合集,掩膜区域为1,背景为0。

通过np.count_nonzero去计算这五个方法计算掩膜后,像素值为1的个数。

四、注意事项

在获取掩膜后,需要对图片进行裁剪,在裁剪过程中需要注意将掩膜转换为二值图像,转换代码如下面所示。

4.1代码

python 复制代码
# 将mask的值转换为二值图像(0或255),并确保类型为uint8
binary_mask = (mask  * 255).astype(np.uint8)  # 0或255

# 确保binary_mask是二值图像(0和255)
_, binary_mask = cv2.threshold(binary_mask, 1, 255, cv2.THRESH_BINARY)

#获取到最后检测出来的目标图
result_image = cv2.bitwise_and(image, image, mask=binary_mask)

4.2代码解析

下面逐行解释这段代码的作用和每个步骤的目的:

python 复制代码
# 将mask的值转换为二值图像(0或255),并确保类型为uint8
binary_mask = (mask  * 255).astype(np.uint8)  # 0或255

**转换为二值图像:**这一行代码将原始的 mask 数据进行转换,目的是将其值缩放到一个适合的范围内,以便后续的处理。mask 可能包含的值在 0 到 1 之间,因此乘以 255 来将值映射到 0 到 255 的范围内。这将 mask 转换为二值图像,其中 0 表示像素被排除,255 表示像素被选中。.astype(np.uint8) 确保 binary_mask 的数据类型为 uint8,以便与 OpenCV 函数兼容。

python 复制代码
# 确保binary_mask是二值图像(0和255)
_, binary_mask = cv2.threshold(binary_mask, 1, 255, cv2.THRESH_BINARY)

二值化处理:cv2.threshold 函数用于对图像进行阈值化处理,将其转换为二值图像。在这里,cv2.threshold 函数将 binary_mask 中大于 1 的像素设置为 255(白色),小于等于 1 的像素设置为 0(黑色)。这确保 binary_mask 只包含值为 0 和 255 的像素,符合二值图像的要求。

python 复制代码
# 获取到最后检测出来的目标图
result_image = cv2.bitwise_and(image, image, mask=binary_mask)

**应用掩膜:**cv2.bitwise_and 函数用于将 binary_mask 应用于 image 上,只保留binary_mask 中像素值为 255 的区域对应的 image 像素。这样可以得到 result_image,其中只有 binary_mask 中被选中的区域保留了 image 的像素值,其他区域被遮挡或去除。

**总结:**这段代码的目的是根据 mask 数据提取出 image 中被选中的区域,并且保证输出的 result_image 只包含 mask 中被选中的部分的图像信息。

相关推荐
程序员三藏6 小时前
接口测试及常用接口测试工具总结
自动化测试·软件测试·python·测试工具·职场和发展·测试用例·接口测试
小二·7 小时前
Python Web 开发进阶实战 :AI 原生数字孪生 —— 在 Flask + Three.js 中构建物理世界实时仿真与优化平台
前端·人工智能·python
spcier7 小时前
图论拓扑排序-Kahn 算法
算法·图论
知星小度S7 小时前
动态规划(一)——思想入门
算法·动态规划
ysa0510307 小时前
动态规划-逆向
c++·笔记·算法
燃于AC之乐7 小时前
我的算法修炼之路--7—— 手撕多重背包、贪心+差分,DFS,从数学建模到路径DP
c++·算法·数学建模·深度优先·动态规划(多重背包)·贪心 + 差分
chinesegf8 小时前
文本嵌入模型的比较(一)
人工智能·算法·机器学习
2501_941837268 小时前
【计算机视觉】基于YOLOv26的交通事故检测与交通状况分析系统详解_1
人工智能·yolo·计算机视觉
hmywillstronger8 小时前
【Rhino】【Python】 查询指定字段并cloud标注
开发语言·python
We་ct8 小时前
LeetCode 6. Z 字形变换:两种解法深度解析与优化
前端·算法·leetcode·typescript