RV1126 NO.42:OPENCV形态学基础之一:膨胀

一.膨胀的原理：

数学表达式：dst(x,y) = dilate(src(x,y)) = max(x,y)src(x+x,y+y)

图像膨胀是形态学处理的一项基本操作，其核心原理是求取图像的局部最大值。数学表达式可以表示为：dst(x,y) = dilate(src(x,y)) = max(x,y)src(x+x,y+y)。

从数学本质来看，膨胀和腐蚀都是图像与核的卷积运算。卷积是一种通过两个函数生成第三个函数的数学运算，其积分形式为(f * g)(t) =∫f(τ)g(t -τ)dτ。如图1所示，图像A与结构元素B进行卷积运算后，形成了右侧的A⊕B结果图像。

这里提到的"核"可以是任意形状和大小的结构元素，通常采用中心对称的正方形或圆形。膨胀运算的具体过程是：图像与核进行卷积后，计算卷积区域的最大值，并将该最大值赋给指定像素（如图1所示）。经过此处理后，图像整体会变得更加明亮，如图2所示。

(图一) （图二）

图2就是膨胀前和膨胀后图像的对比。从这张图我们可以看出来，右边经过dilate膨胀操作后整个图像更加的明亮和粗糙。

二.膨胀的API讲解：

2.1.dilate的API

在OPENCV中，有一个专门的API去处理图像的膨胀，这个API就是dilate

cpp 复制代码

void dilate( InputArray src, OutputArray dst, InputArray kernel, Point anchor, int iterations, int borderType, const Scalar& borderValue )

第一个参数：src 的类型是InputArray，它指的是输入图像，它可以是Mat类的数据。图像的通道数可以是任意数，但是图像的深度一般是CV_8U，CV_16U，CV_16S，CV_32F，CV_64F

第二个参数：dst的类型是OutputArray，它指的是目标图像，值得注意的是输出图像的尺寸、类型要和输入图像是一致的。

第三个参数：InputArray 类型的kernel，膨胀操作的核。当这个值为NULL的时候，表示使用的核参考点默认是3*3。这个参数通常会配合getStructingElement 参数的使用(这个参数的使用，下面我会详细说到)。

****第四个参数：****Point类型的anchor，描点的位置，默认是(-1,-1)，表示中心位置。

****第五个参数：****int类型的迭代次数，默认是1

****第六个参数：****int类型的borderType，这个类型用于推断图像外部的边界模式，用的最多的是BORDER_DEFAULT

cpp 复制代码

enum BorderTypes {
    BORDER_CONSTANT    = 0, //!< `iiiiii|abcdefgh|iiiiiii`  with some specified `i`
    BORDER_REPLICATE   = 1, //!< `aaaaaa|abcdefgh|hhhhhhh`
    BORDER_REFLECT     = 2, //!< `fedcba|abcdefgh|hgfedcb`
    BORDER_WRAP        = 3, //!< `cdefgh|abcdefgh|abcdefg`
    BORDER_REFLECT_101 = 4, //!< `gfedcb|abcdefgh|gfedcba`
    BORDER_TRANSPARENT = 5, //!< `uvwxyz|abcdefgh|ijklmno`

    BORDER_REFLECT101  = BORDER_REFLECT_101, //!< same as BORDER_REFLECT_101
    BORDER_DEFAULT     = BORDER_REFLECT_101, //!< same as BORDER_REFLECT_101
    BORDER_ISOLATED    = 16 //!< do not look outside of ROI
};

下面是常用的几种边框模式(这几种相对比较常用，其他的用的很少)

****BORDER_CONSTANT：****用指定的像素填充边框

****BORDER_REPLICATE：****用已知的边缘像素来填充边框

****BORDER_WRAP：****用另一边的像素来补偿填充

****BORDER_DEFAULT：****默认模式画边框

****BORDER_TRANSPANT:****用透明的方式画框

第七个参数：const Scalar 类型的borderType，一般不用填写，因为这个API已经有了默认值morphologyDefaultBorderValue()

2.2. getStructingElement的API

该函数的作用是返回一个卷积层，！！！该函数仅生成结构元素（核），不涉及图像数据，就是说这里并不是直接操作图像本身。

CV_EXPORTS_W Mat getStructuringElement(int shape, Size ksize, Point anchor = Point(-1,-1));

第一个参数： 表示内核的形状，这里包括了：矩形(MORPH_RECT )、交叉形(MORPH_CROSS )、椭圆形(MORPH_ELLIPSE)，常用的内核形状是矩形

****第二个参数：****内核的尺寸

****第三个参数：****锚点的位置，默认值Point(-1,-1)，表示的是位于中心点

三.用OPENCV代码实现图像膨胀功能：

3.1. 用OPENCV实现膨胀功能的大体流程图

从上面的流程图我们可以看出来OPENCV实现膨胀功能需要有以下几步，分别是：imread 读取图片、使用cvtColor对图片进行灰度操作、使用getStructingElement 获取卷积层、使用dilate 对图片进行膨胀、imwrite保存图片

3.2.代码分步流程

3.2.1. 读取我们需要处理的图片

cpp 复制代码

    Mat testImage = imread("drink.png");
    if(testImage.empty())
    {
        printf("read testImage failed....\n");
    }

使用imread读取我们需要处理的图片

3.2.2. 获取卷积层

cpp 复制代码

Mat vertical_structure = getStructuringElement(MORPH_RECT, Size(15,15));

使用getStructuringElement 获取卷积层，参数设置内核的形状是MORPH_RECT、 内核的长度是Size(15,15)

3.2.3. dilate对图片进行膨胀操作

cpp 复制代码

dilate(testImage, testImage, vertical_structure);

获取完卷积层后，我们就对图片进行dilate膨胀，关于dilate的API上面已经详细说到了。最后用imwrite保存图片(这里就省略)

经过上述处理过后，我们来看看原图和处理后的图片效果：

左侧为原始图像，右侧展示的是经过膨胀处理后的效果图。对比可见，经过膨胀处理的图像亮度显著提升且纹理更加粗糙。这是由于膨胀操作本质上是将原始图像与卷积核进行叠加运算，导致图像整体像素值增大所致。

完整代码:

cpp 复制代码

#include <opencv2/opencv.hpp>
#include <opencv2/dnn.hpp>
#include <opencv2/imgcodecs.hpp>
#include <opencv2/imgproc.hpp>
#include <iostream>

using namespace cv;
using namespace std;

int main()
{
    Mat testImage = imread("drink.png");
    if(testImage.empty())
    {
        printf("read testImage failed....\n");
    }

    Mat vertical_structure = getStructuringElement(MORPH_RECT, Size(15,15));
    dilate(testImage, testImage, vertical_structure);
    imwrite("dilate_process.jpg", testImage);

    return 0;
}