1 边缘检测介绍
图像边缘检测技术是图像处理和计算机视觉等领域最基本的问题,也是经典的技术难题之一。如何快速、精确地提取图像边缘信息,一直是国内外的研究热点,同时边缘的检测也是图像处理中的一个难题。早期的经典算法包括边缘算子方法、曲面拟合的方法、模板匹配方法、阈值法等。
近年来,随着数学理论与人工智能技术的发展,出现了许多新的边缘检测方法,如Roberts、Laplacan、Canny等图像的边缘检测方法。这些方法的应用对于高水平的特征提取、特征描述、目标识别和图像理解有重大的影响。然而,在成像处理的过程中投影、混合、失真和噪声等会导致图像模糊和变形,这使得人们一直致力于构造具有良好特性的边缘检测算子。
1.1 什么是边缘检测
边缘检测是图像处理和计算机视觉中的基本问题,边缘检测的目的是标识数字图像中亮度变化明显的点。图像属性中的显著变化通常反映了属性的重要事件和变化,包括深度不连续、表面方向不连续、物质属性变化和场景照明变化。边缘检测特征是提取中的一个研究领域。图像边缘检测大幅度地减少了数据量,并且剔除了可以认为不相关的信息,保留了图像重要的结构属性。
1.2 边缘检测的方法
人类视觉系统认识目标的过程分为两步:首先,把图像边缘与背景分离出来;然后,到图像的细节,辨认出图像的轮廓。计算机视觉正是模仿人类视觉的过程。
因此,在检测物体边缘时先对轮廓点进行粗略检测,然后通过链接规则把原来检测到的轮廓点连接起来,同时检测和连接遗漏的边界点及去除虚假的边界点。图像的边缘是图像的重要特征,是计算机视觉、模式识别等的基础,因此边缘检测是图像处理中一个重要的环节。然而,边缘检测是图像处理中的一个难题,因为实际景物图像的边缘往往是各种类型的边缘及它们模糊化后结果的组合,且实际图像信号存在噪声。噪声和边缘都属于高频信号,很难用频带做取舍。
边缘是指图像周围像素灰度有阶跃变化或屋顶状变化的像素集合,存在于目标与背景、目标与目标、区域与区域、基元与基元之间。边缘具有方向和幅度两个特征,沿边缘走向,像素值变化比较平缓;垂直于边缘走向,像素值变化比较剧烈,可能呈现阶跃状,也可能呈现斜坡状。因此,边缘可以分为两种:
-
一种为阶跃性边缘,两边的像素灰度值有着明显的不同;
-
另一种为屋顶状边缘,位于灰度值从增加到减少的变化转折点。
对于阶跃性边缘,二阶方向导数在边缘处呈零交叉;对于屋顶状边缘,二阶方向导数在边缘处取极值。有许多方法可以用于边缘检测,绝大部分可以划分为两类:基于搜索的一类和基于零穿越的一类。
- 基于搜索:通过寻找图像一阶导数中的最大值来检测边界,然后利用计算结果估计边缘的局部方向,通常采用梯度的方向,并利用此方向找到局部梯度模的最大值,代表算法是Sobel算子和Scharr算子。
- 基于零穿越:通过寻找图像二阶导数零穿越来寻找边界,代表算法是Laplacian算子。
1.3 典型算子比较
|-----------|------------------------------------------------------------------------------------------------------------------------------------------------|
| 算子 | 优缺点 |
| Roberts | 对具有陡峭的低噪声的图像处理效果较好,但利用Roberts算子提取边缘的结果是边缘比较粗,因此边缘定位不是很准确 |
| Sobel | 对灰度渐变和噪声较多的图像处理效果比较好,Sobel算子对边缘定位比较准确 |
| Kirsch | 对灰度渐变和噪声较多的图像处理效果较好 |
| Prewitt | 对灰度渐变和噪声较多的图像处理效果较好 |
| Laplacian | 对图像中的阶跃性边缘点定位准确,对噪声非常敏感,丢失一部分边缘的方向信息,造成一些不连续的检测边缘 |
| LoG | LoG算子经常出现双边缘像素边界,而且该检测算法对噪声比较敏感,所以很少用LoG算子检测边缘,而是用来判断边缘像素是位于图像的明区还是暗区 |
| Canny | 此方法不容易受噪声的干扰,能够检测到真正的弱边缘。在edge函数中,最有效的边缘检测方法是Canny方法。该方法的优点在于使用两种不同的阈值分别检测强边缘和弱边缘,并且仅当弱边缘和强边缘相连时,才将弱边缘包含在输出图像中。因此,这种方法不容易被噪声"填充",更容易检测出真正的弱边缘。 |
2 使用opencv的Laplacian算子实现边缘检测
Laplacian算子是一种图像处理中常用的边缘检测算子,它用于检测图像中的边缘和轮廓。该算子计算图像中每个像素点的二阶导数,从而突出图像中灰度值变化较大的区域,这些区域通常对应图像的边缘或者轮廓。
2.1 检测原理
Laplacian是利用二阶导数来检测边缘 。 因为图像是 "2维", 我们需要在两个方向求导,如下式所示:
那不连续函数的二阶导数是:
那使用的卷积核是:
2.2 检测过程
Laplacian算子的一种常用形式是二维离散Laplacian算子,表示为:
0 1 0
1 -4 1
0 1 0
该算子是一个3x3的矩阵,它对应的是图像中每个像素点的上、下、左、右四个方向的像素值以及像素点本身的像素值之间的差值。
应用Laplacian算子的过程如下:
-
将3x3的Laplacian算子依次对图像中的每个像素点进行卷积操作。
-
将卷积结果作为图像的每个像素点的新像素值。
-
对于卷积结果,如果像素值较大,则表示该像素点周围灰度值变化较大,可能是图像中的边缘或轮廓。
Laplacian 算子类似二阶 Sobel 导数,需要计算两个方向的梯度值。
Laplacian 算子类似二阶 Sobel 导数,需要计算两个方向的梯度值。例如,在图 9-25 中:
-
左图是 Laplacian 算子。
-
右图是一个简单图像,其中有 9 个像素点。
计算像素点 P5 的近似导数值,如下:
P5lap = (P2 + P4 + P6 + P8) - 4·P5
图 9-26 展示了像素点与周围点的一些实例,其中:
-
在左图中,像素点 P5 与周围像素点的值相差较小,得到的计算结果值较小,边缘不明显。
-
在中间的图中,像素点 P5 与周围像素点的值相差较大,得到的计算结果值较大,边缘较明显。
-
在右图中,像素点 P5 与周围像素点的值相差较大,得到的计算结果值较大,边缘较明显。
需要注意,在上述图像中,计算结果的值可能为正数,也可能为负数。所以,需要对计算结果取绝对值,以保证后续运算和显示都是正确的。
2.3 Laplacian函数原型
laplacian = cv2.Laplacian(src, ddepth[, dst[, ksize[, scale[, delta[, borderType]]]]])
参数:
-
Src
: 需要处理的图像, -
Ddepth
: 图像的深度,-1
表示采用的是原图像相同的深度,目标图像的深度必须大于等于原图像的深度; -
ksize
:算子的大小,即卷积核的大小,必须为1,3,5,7
。
2.4 检测代码
import cv2 as cv
import numpy as np
from matplotlib import pyplot as plt
# 1 读取图像
img = cv.imread('../data/girl04.jpeg', 0)
# 2 laplacian转换
result = cv.Laplacian(img, cv.CV_16S)
Scale_abs = cv.convertScaleAbs(result)
# 3 图像展示
plt.figure(figsize=(10, 8), dpi=100)
plt.subplot(121)
plt.imshow(img, cmap=plt.cm.gray)
plt.title('original')
plt.xticks([])
plt.yticks([])
plt.subplot(122)
plt.imshow(Scale_abs, cmap=plt.cm.gray)
plt.title('Laplacian')
plt.xticks([])
plt.yticks([])
plt.show()
运行代码显示: