OPENCV形态学基础之一膨胀

一.膨胀的原理

数学表达式: dst(x,y) = dilate(src(x,y)) = max(x,y)src(x+x,y+y)

膨胀是图像形态学的基本功能之一,膨胀顾名思义就是求图像的局部最大值操作,它的数学表达式是dst(x,y) = dilate(src(x,y)) = max(x,y)src(x+x,y+y)

从数学的角度来看,无论是膨胀还是腐蚀实际上就是把图像跟核进行卷积(**卷积:**是通过两个函数f和g生成第三个函数的一种数学运算,它的本质就是微积分的转换,积分转换的数学公式

(f * g)(t) = f( τ )g(t - τ )d τ ),如上图:图像A和形状B进行卷积操作,然后形成右边的图像,右边的图像就是A+B的图像点。所谓的核就是指任意的形状或者大小,在多数情况下,核是一个小的中间带的正方形或者圆形。

膨胀本质上就是把图像与核进行卷积操作,然后计算出卷积区域的最大点,并把最大的值赋值给指定的像素(如上图)。操作完成之后,图像就会更加明亮(如下图)。

这是膨胀前和膨胀后图像的对比。从这张图我们可以看出来,右边经过dilate膨胀操作后整个图像更加的明亮和粗糙。

二.膨胀的API讲解:

1.dilate API

在OPENCV中,有一个专门的API去处理图像的膨胀,这个API就是dilate

复制代码
void dilate( InputArray src, 
            OutputArray dst, 
            InputArray kernel,
            Point anchor, 
            int iterations, 
            int borderType, 
            const Scalar& borderValue )

第一个参数: src 的类型是InputArray,它指的是输入图像 ,它可以是Mat类的数据。图像的通道数可以是任意数,但是图像的深度一般是CV_8U CV_16U CV_16S CV_32F CV_64F

第二个参数: dst 的类型是OutputArray,它指的是目标图像,值得注意的是输出图像的尺寸、类型要和输入图像是一致的。

第三个参数: InputArray 类型的kernel,膨胀操作的核 。当这个值为NULL的时候,表示使用的核参考点默认是3*3。这个参数通常会配合getStructuringElement 参数的使用(这个参数的使用,下面我会详细说到)

**第四个参数:**Point类型的anchor,描点的位置,默认是(-1,-1),表示中心位置。

**第五个参数:**int类型的迭代次数,默认是1

**第六个参数:**int类型的borderType,这个类型用于推断图像外部的边界模式,用的最多的是BORDER_DEFAULT

下面是常用的几种边框模式(这几种相对比较常用,其他的用的很少)

1.BORDER_CONSTANT **:**用指定的像素填充边框(指定颜色画框)

2.BORDER_REPLICATE **:**用已知的边缘像素来填充边框(当前图像的颜色画框)

3.BORDER_WRAP **:**用另一边的像素来补偿填充

4.BORDER_DEFAULT **:**默认模式画边框

**5.BORDER_TRANSPANT:**用透明的方式画框

第七个参数: const Scalar 类型的borderType,一般不用填写 ,因为这个API已经有了默认值morphologyDefaultBorderValue()

2. getStructingElement API

该函数的作用是返回一个卷积层

复制代码
CV_EXPORTS_W Mat getStructuringElement(int shape, 
                                       Size ksize, 
                                       Point anchor = Point(-1,-1));

**第一个参数:**表示内核的形状,这里包括了:

1.矩形(MORPH_RECT),大部分使用这一个

2.交叉形(MORPH_CROSS)

3.椭圆形(MORPH_ELLIPSE)

常用的内核形状是矩形

**第二个参数:**内核的尺寸

第三个参数: 锚点的位置,默认值Point(-1,-1),表示的是位于图像中心点

三.代码实战

大致流程框图

复制代码
#include <opencv2/opencv.hpp>
#include <opencv2/dnn.hpp>
#include <opencv2/imgcodecs.hpp>
#include <opencv2/imgproc.hpp>
#include <iostream>

using namespace cv;
using namespace std;

int main()
{
    Mat img=imread("people.jpg");
    if(img.empty())
    {
        cerr<< "read bloast is failed\n"<< endl;
        std::cout <<"failed\n"<<std::endl;        
    }
    //Size(15,15)内核尺寸
    Mat juanji_concept =getStructuringElement(MORPH_RECT,Size(15,15));
    //进行膨胀
    dilate(img,img,juanji_concept);
    imwrite("bloast_process.jpg",img);

    return 0;
}

原图 膨胀后的

相关推荐
薛定猫AI5 分钟前
【深度解析】Hermes Agent 与 Hermes Desktop:长期记忆、技能沉淀与多端网关的开源 AI Agent 实战
人工智能·开源
xwz小王子8 分钟前
给机器人装上脊髓反射:AT-VLA 如何把触觉塞进 VLA,并把闭环响应压到 40 毫秒
人工智能·机器人
通信小呆呆9 分钟前
注意力机制用于信号同步:从匹配滤波到可学习对齐
人工智能·学习·机器学习·信息与通信
掌动智能10 分钟前
传统数据工厂之死:RunnerAgent如何开启AI驱动的“数据生产”新纪元
人工智能·测试工具·自动化
shchojj13 分钟前
Generative AI applications -- Reading
人工智能
青山科技分享22 分钟前
iPaaS推荐:五大集成平台推荐指南
大数据·人工智能·ipaas推荐
羊羊小栈25 分钟前
基于「YOLO目标检测 + 多模态AI分析」的篮球动作规范智能检测分析预警系统
人工智能·yolo·目标检测·计算机视觉·毕业设计·大作业
天上路人26 分钟前
双波束拾音技术在双向翻译机中的应用 —— 基于 A-59F 模组的原理、效果与场景解析
人工智能·语音识别
Fleshy数模28 分钟前
基于 LangChain 实现 PDF 文档检索:从加载到向量检索全流程
人工智能·数据挖掘·langchain·大模型
小袁说公考34 分钟前
公考培训机构2025年度测评:财务健康度与用户体验重构排名格局
大数据·人工智能·经验分享·笔记·其他·重构·ux