【OpenCV实现平滑图像形态学变化】

文章目录

概要

形态学变化是一组简单的图像操作,主要用于处理二值图像,即只包含黑和白两种颜色的图像。这些操作通常需要两个输入,原始图像和一个内核(kernel),内核的形状和大小决定了操作的性质。

文章将首先介绍腐蚀和膨胀这两个基本的形态学算子。腐蚀操作通过内核在图像上滑动,将像素值置为内核覆盖区域内的最小值,用于消除图像中的小物体或者噪点。相反,膨胀操作将像素值置为内核覆盖区域内的最大值,常用于连接图像中的物体或者填充小的空洞。

随后,文章将介绍其他常见的形态学算子,如开运算和闭运算。开运算是先进行腐蚀操作,再进行膨胀操作,常用于去除噪声和分离物体。闭运算则是先进行膨胀操作,再进行腐蚀操作,常用于填充小洞和连接物体

目标

不同的形态学运算例如腐蚀、膨胀、开运算、闭运算。

不同的函数列如cv.erode()、cv.dilate()、cv.morphologyEx()等等。

腐蚀

是一种基本的形态学操作,其原理类似于自然界中的水土流失现象。在腐蚀操作中,一个内核(kernel)在图像上滑动,如果内核覆盖下的所有像素都为1(即白色,表示前景物体),那么中心像素点就会被赋值为1,否则被腐蚀掉(赋值为0)。

这种操作导致了图像中前景物体的边界被侵蚀,保持前景物体为白色的同时,减小了其厚度或尺寸。换句话说,图像中的白色区域会逐渐减小。腐蚀操作在去除小白点噪声(例如图像中的小杂点)和分离连接在一起的对象等方面非常有效。通过选择合适的内核大小,可以调整腐蚀的程度,使其更加适应不同场景下的图像处理需求。

bash 复制代码
import cv2 as cv
import numpy as np

# 读取图像
img = cv.imread('img.png', 0)

# 创建一个 5x5 的内核(矩阵)
kernel = np.ones((5, 5), np.uint8)

# 使用腐蚀操作,iterations参数表示腐蚀操作的次数
erosion = cv.erode(img, kernel, iterations=1)

# 显示原始图像
cv.imshow('Original Image', img)

# 显示腐蚀后的图像
cv.imshow('Eroded Image', erosion)

# 等待用户按下任意键后关闭窗口
cv.waitKey(0)
cv.destroyAllWindows()

腐蚀结果:

膨胀

膨胀是一种形态学操作,与腐蚀相反。它的基本思想是通过内核的滑动,只要内核下的像素中有一个为1,中心像素就会被赋值为1(这类似于逻辑或运算)。膨胀操作会扩大白色物体(或前景物体)的区域或大小。在去除噪声时,通常会先进行腐蚀操作,然后再进行膨胀操作。这是因为腐蚀能够去除小的白色噪声,但同时也可能腐蚀掉我们需要保留的物体。膨胀操作的目的就是扩大物体,使其恢复到原始大小和形状。

在膨胀操作中,噪声已经在腐蚀阶段被去除,因此在膨胀时不会再次引入噪声,但物体的大小和体积会得到恢复。此外,膨胀操作还对有破损或间断连接的物体部分进行恢复,使其更加完整。通过膨胀操作,可以使图像中的白色区域逐渐增大,从而更好地突出物体的特征。

开运算

开运算只是先腐蚀后膨胀的另一个名称。正如我们上面所解释的,它对于消除噪音很有用。这里我们函数cv.morphologyEx()。

bash 复制代码
import cv2 as cv
import numpy as np

# 读取图像
img = cv.imread('img.png', 0)

# 创建一个 5x5 的内核(矩阵)
kernel = np.ones((5, 5), np.uint8)

# 使用开运算,先腐蚀后膨胀,可以去除噪声并保持物体的整体形状
opening = cv.morphologyEx(img, cv.MORPH_OPEN, kernel)

# 显示原始图像
cv.imshow('Original Image', img)

# 显示开运算后的图像
cv.imshow('Opened Image', opening)

# 等待用户按下任意键后关闭窗口
cv.waitKey(0)
cv.destroyAllWindows()

闭运算

闭运算和开运算相反,先膨胀后腐蚀。它对于关闭前景对象内的小孔或对象上的小黑点非常有用。

bash 复制代码
import cv2 as cv
import numpy as np

# 读取图像
img = cv.imread('img.png', 0)

# 创建一个 5x5 的内核(矩阵)
kernel = np.ones((5, 5), np.uint8)

# 使用闭运算,先膨胀后腐蚀,可以填充前景物体内部的小孔,平滑物体的边界
closing = cv.morphologyEx(img, cv.MORPH_CLOSE, kernel)

# 显示原始图像
cv.imshow('Original Image', img)

# 显示闭运算后的图像
cv.imshow('Closed Image', closing)

# 等待用户按下任意键后关闭窗口
cv.waitKey(0)
cv.destroyAllWindows()

形态梯度

这是图像的膨胀和腐蚀之间做了一次差

结果将看起来像只留下对象的轮廓。

bash 复制代码
import cv2 as cv
import numpy as np

# 读取图像
img = cv.imread('img.png', 0)

# 创建一个 5x5 的内核(矩阵)
kernel = np.ones((5, 5), np.uint8)

# 使用形态梯度,通过膨胀和腐蚀的差别,突出物体的边缘
gradient = cv.morphologyEx(img, cv.MORPH_GRADIENT, kernel)

# 显示原始图像
cv.imshow('Original Image', img)

# 显示形态梯度后的图像
cv.imshow('Gradient Image', gradient)

# 等待用户按下任意键后关闭窗口
cv.waitKey(0)
cv.destroyAllWindows()

顶帽

它是输入图像和开运算图像之间的差。下面的示例是针对 9x9 内核完成的。

bash 复制代码
import cv2 as cv
import numpy as np

# 读取图像
img = cv.imread('img.png', 0)

# 创建一个 5x5 的内核(矩阵)
kernel = np.ones((5, 5), np.uint8)

tophat = cv.morphologyEx(img, cv.MORPH_TOPHAT, kernel)

# 显示原始图像
cv.imshow('Original Image', img)

# 显示形态梯度后的图像
cv.imshow('Gradient Image', tophat)

# 等待用户按下任意键后关闭窗口
cv.waitKey(0)
cv.destroyAllWindows()

底帽

它是闭运算图像和输入图像的差

bash 复制代码
import cv2 as cv
import numpy as np

# 读取图像
img = cv.imread('img.png', 0)

# 创建一个 5x5 的内核(矩阵)
kernel = np.ones((5, 5), np.uint8)

blackhat = cv.morphologyEx(img, cv.MORPH_BLACKHAT, kernel)
# 显示原始图像
cv.imshow('Original Image', img)

# 显示形态梯度后的图像
cv.imshow('Gradient Image', blackhat)

# 等待用户按下任意键后关闭窗口
cv.waitKey(0)
cv.destroyAllWindows()

结构元素(内核)

在形态学变换中,我们经常需要定义一个内核来指导图像处理。在前面的例子中,我们手动创建了一个矩形内核,但在实际应用中,可能需要不同形状和大小的内核。为了方便地获取这些内核,OpenCV提供了一个函数cv.getStructuringElement()。

使用该函数,您只需要传递内核的形状和大小,就可以获得所需的内核。

bash 复制代码
cv.getStructuringElement(cv.MORPH_RECT, (5, 5))

如果需要一个椭圆形内核,可以使用以下代码:

bash 复制代码
cv.getStructuringElement(cv.MORPH_ELLIPSE, (5, 5))

类似地,如果需要一个十字形内核,可以使用

bash 复制代码
cv.getStructuringElement(cv.MORPH_CROSS, (5, 5))

小结

形态学变换是一种基于图像形状的简单而有效的处理方法,通常应用于二值图像(只包含黑白两种颜色)。在形态学变换中,我们使用内核(也称为结构化元素)来定义操作的性质和形状。

腐蚀是一种形态学变换,它侵蚀了前景物体(白色区域)的边界,通常用于去除小白点噪声或分离连接的对象。使用cv.erode()函数,我们可以将内核滑动在图像上,将内核覆盖下的像素点都为1时,中心像素点就会被赋值为1,其他时候都为0,从而缩小白色区域。

膨胀则与腐蚀相反,它会扩大白色物体的区域,常用于恢复连接对象的大小和形状。使用cv.dilate()函数,内核覆盖下的像素点只需有一个为1,中心像素点就会被赋值为1,从而扩大白色区域。

开运算是先腐蚀后膨胀的组合操作,它可以去除噪声并保持物体的整体形状。闭运算则是先膨胀后腐蚀的组合操作,它可以填充前景物体内部的小孔,平滑物体的边界。这两种操作分别使用cv.morphologyEx()函数中的cv.MORPH_OPEN和cv.MORPH_CLOSE参数实现。

为了方便地定义不同形状和大小的内核,OpenCV提供了cv.getStructuringElement()函数。通过传递内核的形状和大小参数,可以获得所需的内核。矩形、椭圆和十字形内核是常见的选择,可以根据具体任务的要求灵活选择合适的内核形状。

相关推荐
波音彬要多做1 分钟前
41 stack类与queue类
开发语言·数据结构·c++·学习·算法
Swift社区9 分钟前
Excel 列名称转换问题 Swift 解答
开发语言·excel·swift
一道微光13 分钟前
Mac的M2芯片运行lightgbm报错,其他python包可用,x86_x64架构运行
开发语言·python·macos
矛取矛求17 分钟前
QT的前景与互联网岗位发展
开发语言·qt
Leventure_轩先生17 分钟前
[WASAPI]从Qt MultipleMedia来看WASAPI
开发语言·qt
普密斯科技28 分钟前
手机外观边框缺陷视觉检测智慧方案
人工智能·计算机视觉·智能手机·自动化·视觉检测·集成测试
向宇it31 分钟前
【从零开始入门unity游戏开发之——unity篇01】unity6基础入门开篇——游戏引擎是什么、主流的游戏引擎、为什么选择Unity
开发语言·unity·c#·游戏引擎
四口鲸鱼爱吃盐41 分钟前
Pytorch | 利用AI-FGTM针对CIFAR10上的ResNet分类器进行对抗攻击
人工智能·pytorch·python
lishanlu13642 分钟前
Pytorch分布式训练
人工智能·ddp·pytorch并行训练
是娜个二叉树!1 小时前
图像处理基础 | 格式转换.rgb转.jpg 灰度图 python
开发语言·python