Opencv之图像梯度处理和绘制图像轮廓

一、梯度处理的sobel算子函数

处理示意

Sobel 算子是一种常用的图像边缘检测方法,结合了一阶导数和高斯平滑,用于检测图像的梯度信息。

1、功能

Sobel 算子用于计算图像在 x 和 y 方向的梯度,主要功能包括:

  • 强调图像中灰度值的变化部分,用于检测边缘。
  • 计算水平和垂直方向的梯度值。
  • 提供平滑效果以减少噪声干扰(相比于简单差分方法)。

2、参数

在 OpenCV 中,cv2.Sobel() 是实现 Sobel 算子的主要函数。其常用参数包括:

参数名 说明
src 输入图像,它应该是灰度图像。
ddepth 输出图像的所需深度(数据类型)。通常,你可以使用 -1 来表示与输入图像相同的深度,或者使用如 cv2.CV_64F 等来指定特定的深度。由于梯度计算可能产生负值,因此建议使用能够包含负数的数据类型。
dx x 方向上的导数阶数。如果你想要计算 x 方向上的梯度,设置这个参数为 1;如果你不关心 x 方向上的梯度,设置这个参数为 0。
dy y 方向上的导数阶数。如果你想要计算 y 方向上的梯度,设置这个参数为 1;如果你不关心 y 方向上的梯度,设置这个参数为 0。通常,你不会同时设置 dx 和 dy 都为 0。
ksize Sobel 核的大小。它必须是 1、3、5、7 或 9 之一。这个参数决定了用于计算梯度的滤波器的大小。大小为 1 时表示使用最小的滤波器,但通常你会使用更大的滤波器来平滑梯度计算。
scale 可选参数,表示计算梯度时的缩放因子。默认值为 1,表示不进行缩放。你可以通过调整这个参数来放大或缩小梯度的结果。
delta 可选参数,表示在将结果存储到目标图像之前要添加到结果中的可选增量值。默认值为 0,表示不添加增量。
borderType 像素外推方法,例如 cv2.BORDER_DEFAULT、cv2.BORDER_REFLECT 等。这个参数决定了在图像边界处如何处理像素外推。

3、返回值

  • 返回一个与输入图像尺寸相同的单通道图像。
  • 结果图像的每个像素值代表该点的梯度值。

4、应用

Sobel 算子广泛用于以下应用场景:

①边缘检测:

用于检测图像中显著的灰度值变化,通常是物体的边缘。

②图像增强:

提取图像的边缘特征以增强感兴趣的区域。

③特征提取:

在计算机视觉任务中,用作边缘特征检测的一步,例如人脸检测、车道线检测等。

④梯度方向计算:

与梯度幅值一起,用于方向敏感的应用,如方向滤波。

5、代码示例

python 复制代码
import cv2

# 读取一张图
img = cv2.imread("./shudu.png")
img = cv2.resize(img, (img.shape[1] // 2, img.shape[0] // 2))

# 使用sobel算子
# 水平梯度
img_sobel = cv2.Sobel(img, -1, 0, 1, ksize=3)
# 垂直梯度
img_sobel_2 = cv2.Sobel(img, -1, 1, 0, ksize=3)

cv2.imshow('image', img)
cv2.imshow('img_sobel', img_sobel)
cv2.imshow('img_sobel_2', img_sobel_2)

cv2.waitKey(0)

Sobel算子代码效果

二、梯度处理Laplacian算子函数

Laplacian 算子是图像处理中的一种二阶导数算子,用于检测图像的边缘。它通过计算图像像素值的二阶导数(即亮度变化率)来突出边缘信息。

1、功能

①边缘检测:

通过计算图像的二阶导数,检测图像中灰度变化较大的区域。

②增强图像细节:

可以提取图像的边缘特征,用于后续处理。

③方向无关:

不同于 Sobel 算子,Laplacian 算子对方向不敏感,计算的是梯度的二阶导数。

2、参数

在 OpenCV 中,cv2.Laplacian() 函数实现了 Laplacian 算子的功能,常用参数包括:

参数名 说明
src 输入图像,它应该是灰度图像。
ddepth 输出图像的所需深度。这个参数决定了输出图像的深度(数据类型)。通常,你可以使用 -1 来表示与输入图像相同的深度,或者使用 cv2.CV_64F 等来指定特定的深度。由于拉普拉斯算子可能产生负值,因此通常建议使用能够包含负数的数据类型,如 cv2.CV_64F。
ksize 算子的大小。它必须是 1、3、5 或 7 之一。这个参数决定了用于计算拉普拉斯算子的滤波器的大小。大小为 1 时表示使用 4 邻域拉普拉斯算子,其他大小则使用更大的滤波器。
scale 可选参数,表示计算拉普拉斯算子时的缩放因子。默认值为 1,表示不进行缩放。你可以通过调整这个参数来放大或缩小拉普拉斯算子的结果。
delta 可选参数,表示在将结果存储到目标图像之前要添加到结果中的可选增量值。默认值为 0,表示不添加增量。
borderType 像素外推方法,例如 cv2.BORDER_DEFAULT、cv2.BORDER_REFLECT 等。这个参数决定了在图像边界处如何处理像素外推。当 ksize 大于 1 时,这个参数才有意义。

3、返回值

  • 返回一个单通道的梯度图像。
  • 每个像素值表示该点的梯度变化强度(即边缘强度)。

4、应用

①边缘检测:

检测图像中显著的灰度变化区域,用于突出边缘。

②特征提取:

在计算机视觉任务中,用于提取边缘作为特征输入,例如物体检测、图像配准等。

③图像增强:

提高图像的细节部分,增强局部特征。

④前处理步骤:

常作为更复杂图像处理(如 Hough 变换)的前置步骤。

5、代码示例

python 复制代码
import cv2

# 读取一张图
img = cv2.imread("./shudu.png")
img = cv2.resize(img, (img.shape[1] // 2, img.shape[0] // 2))

# 使用拉普拉斯算子
img_lap = cv2.Laplacian(img, -1, ksize=3)

cv2.imshow('image', img)
cv2.imshow('img_lap', img_lap)

cv2.waitKey(0)

Laplacian算子代码效果

三、Canny算子函数

双阈值筛选原理

Canny 算子是一种多阶段的图像边缘检测算法,通过计算梯度并结合非极大值抑制和双阈值处理,精准地提取图像中的边缘。

1、功能

①边缘检测:

检测图像中灰度值变化最显著的区域,提取清晰的边缘。

②降噪和增强对比:

使用高斯滤波去噪并结合梯度计算增强边缘对比。

③多阶段边缘检测:

包括梯度计算、非极大值抑制、双阈值处理、边缘跟踪等,能准确且高效地提取边缘。

2、参数

在 OpenCV 中,cv2.Canny() 是实现 Canny 算子的函数,常用参数如下:

3、返回值

  • 返回一个与输入图像尺寸相同的二值图像(边缘图像)。
  • 像素值为 0(非边缘)或 255(边缘)。

4、应用

Canny 算子因其高精度和多功能性,被广泛应用于以下场景:

①物体边缘检测:

用于检测图像中物体的边界,适用于形状识别、分割等任务。

②特征提取:

用于提取边缘特征作为后续算法的输入,例如 Hough 变换、角点检测等。

③图像增强:

突出图像中的边缘部分,提高关键特征的显著性。

④医学图像处理:

用于精确检测器官或病灶的边缘。

5、代码示例

python 复制代码
import cv2

img = cv2.imread("./card.png")
img = cv2.resize(img, (img.shape[1] // 2, img.shape[0] // 2))

# 灰度化
img_gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

# 二值化
_, img_binary = cv2.threshold(img_gray, 127, 255,
                              cv2.THRESH_BINARY + cv2.THRESH_OTSU)

# 寻找轮廓
contours, hierarchy = cv2.findContours(img_binary,
                                       cv2.RETR_LIST,   # 查询轮廓的方式
                                       cv2.CHAIN_APPROX_SIMPLE  # 保存轮廓点坐标的方式
                                       )

# 绘制轮廓
img_copy = img.copy()
img_draw = cv2.drawContours(img_copy, # 要绘制轮廓的图像
                            contours, # 轮廓的顶点坐标集 列表
                            -1, # 轮廓列表的索引值,-1表示绘制所有轮廓
                            (0, 0, 255),  # 颜色
                            3   # 轮廓线条粗细
                            )

cv2.imshow('image', img)
cv2.imshow('image_draw', img_draw)
cv2.waitKey(0)

Canny算子函数代码效果

四、findContours函数

cv2.findContours 是 OpenCV 中用于提取图像轮廓的函数。它在图像分割和分析中非常常用,例如边界检测、形状分析等。

1、功能

①轮廓检测:

在二值化图像中提取轮廓信息。

②轮廓表示:

提取轮廓的点集,可用于计算形状特征(面积、周长等)。

③图像分割:

根据轮廓信息将图像划分为不同的区域。

2、参数

在 OpenCV 中,cv2.findContours() 是用于提取图像轮廓的函数,常用参数如下:

参数名 类型 说明
image 单通道图像 必选参数,输入图像,通常是一个二值图像(即只包含黑白两种颜色的图像),其中白色部分代表要检测的对象,黑色部分代表背景。也可以是非二值图像,但通常需要先进行某种形式的预处理,如阈值分割或边缘检测。
mode 轮廓检索模式 可选参数(某些版本中必需),决定轮廓的层次结构和检索方式。
method 轮廓逼近方法 可选参数(某些版本中必需),决定轮廓点集的存储方式(完整存储或压缩)。
offset‌ 轮廓点的偏移量 可选参数,默认值为 (0, 0),轮廓点的偏移量。这个参数允许你在原始图像坐标系的基础上对轮廓点进行平移。

其中:

①常用的 mode 参数:

  • cv2.RETR_EXTERNAL:只检索最外层轮廓。
  • cv2.RETR_LIST:检索所有轮廓,但不创建任何父子关系。
  • cv2.RETR_CCOMP:检索所有轮廓,并将它们组织为两层结构,其中顶层是连通域的外边界,底层是孔的内边界。
  • cv2.RETR_TREE:检索所有轮廓,并重建完整的层次结构。

②常用的 method 参数:

  • cv2.CHAIN_APPROX_NONE:存储所有的轮廓点,不进行任何近似。
  • cv2.CHAIN_APPROX_SIMPLE:压缩水平、垂直和对角线段,只保留它们的终点。
  • cv2.CHAIN_APPROX_TC89_L1、cv2.CHAIN_APPROX_TC89_KCOS:应用 Teh-Chin 链式近似算法的一种变体。

3、返回值

①contours(某些版本):

这个参数是用来存储检测到的轮廓的。它是一个 Python 列表,其中每个元素都是一个轮廓,轮廓是由点组成的 NumPy 数组。

②hierarchy(某些版本):

轮廓的层次结构信息。这是一个 NumPy 数组,包含了关于轮廓之间关系的信息(例如,哪个轮廓是另一个轮廓的父轮廓或子轮廓)。

4、应用

①形状分析:

提取轮廓用于计算面积、周长、矩形包围框等。

常用于图像中的目标检测和物体分类。

②边界检测:

确定图像中各个目标的边界,用于绘制轮廓或进行边界处理。

③图像分割:

根据轮廓信息分割图像,提取感兴趣的区域。

④嵌套关系分析:

使用 hierarchy 信息分析轮廓的父子关系,用于目标的层次分类。

5、代码示例

python 复制代码
import cv2

img = cv2.imread("./card.png")
img = cv2.resize(img, (img.shape[1] // 2, img.shape[0] // 2))

# 灰度化
img_gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

# 二值化
_, img_binary = cv2.threshold(img_gray, 127, 255,
                              cv2.THRESH_BINARY + cv2.THRESH_OTSU)

# 寻找轮廓
contours, hierarchy = cv2.findContours(img_binary,
                                       cv2.RETR_LIST,   # 查询轮廓的方式
                                       cv2.CHAIN_APPROX_SIMPLE  # 保存轮廓点坐标的方式
                                       )

img_copy = img.copy()
img_draw = cv2.drawContours(img_copy, contours, -1, (0, 0, 255),  3)

cv2.imshow('image', img)
cv2.imshow('image_draw', img_draw)
cv2.waitKey(0)

findContours函数代码效果

五、drawContours函数

OpenCV 的 cv2.drawContours 函数用于在图像上绘制轮廓,常与 cv2.findContours 搭配使用。它可以绘制单个或多个轮廓,还能对层次结构进行可视化。

1、功能

①轮廓绘制:

在图像上绘制由 findContours 提取的轮廓。

②层次关系可视化:

根据轮廓的层次关系选择性地绘制轮廓。

③调试和展示:

在处理图像分割、边缘检测、物体检测等任务时,用于可视化轮廓信息。

2、参数

参数名 类型 说明
contourIdx(可选,默认为 -1) int 指定要绘制的轮廓的索引。如果为 -1,则绘制所有轮廓。否则,只绘制指定索引处的轮廓。
thickness(可选,默认为 1) int 轮廓的厚度。如果为正数,则轮廓将被绘制为指定厚度的线条。如果为负数(例如 -1),则轮廓内部将被填充。
lineType(可选,默认为 cv2.LINE_8) int 线条的类型。它决定了轮廓线条的平滑度。cv2.LINE_8 表示 8-连通线,cv2.LINE_4 表示 4-连通线,cv2.LINE_AA 表示抗锯齿线。
maxLevel(可选,默认为 INT_MAX) int 用于控制绘制轮廓的层次深度。当 contourIdx 参数为 -1 时,这个参数才有效。它决定了要绘制的轮廓的最大层次深度。
contours(必选) list 这是一个 Python 列表,包含要绘制的所有轮廓。每个轮廓都是一个点集,通常是由 cv2.findContours() 函数返回的 NumPy 数组。
image(必选) ndarray 这是要在其上绘制轮廓的输入图像。它应该是一个三通道图像(例如,彩色图像)或单通道图像(例如,灰度图像),但通常是三通道图像,以便可以使用不同的颜色来绘制轮廓。
hierarchy(可选,默认为 None) ndarray 轮廓的层次结构信息。这是一个 NumPy 数组,通常由 cv2.findContours() 函数返回。它包含了关于轮廓之间关系的信息,例如哪个轮廓是另一个轮廓的父轮廓或子轮廓。在绘制所有轮廓时,这个参数通常不需要。
color(可选,默认为 (0, 255, 0)) tuple 轮廓的颜色。它是一个三元组,表示 BGR(蓝、绿、红)颜色空间中的颜色。例如,(0, 255, 0) 表示绿色。
offset(可选,默认为 (0, 0)) tuple 轮廓点的偏移量。这个参数允许你在原始图像坐标系的基础上对轮廓点进行平移。

3、返回值

  • 无返回值。
  • 函数直接在输入图像上绘制轮廓。

4、应用

①轮廓可视化:

在图像处理任务中,显示 findContours 提取的轮廓信息,用于调试和验证算法效果。

②形状分割:

将图像中提取的目标边界可视化,辅助物体分割和分析。

③层次关系分析:

绘制父轮廓、子轮廓等层次结构,用于嵌套目标的可视化。

④目标检测:

在图像上标记物体边界,显示检测结果。

5、代码示例

python 复制代码
import cv2
import numpy as np

# 读取图像并调整大小
img = cv2.imread("./02.png")
img = cv2.resize(img, (img.shape[1] // 2, img.shape[0] // 2))

# 转为灰度图
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

# 二值化
_, img_binary = cv2.threshold(gray, 127, 255, cv2.THRESH_BINARY + cv2.THRESH_OTSU)

# 寻找轮廓
contours, hierarchy = cv2.findContours(img_binary, cv2.RETR_LIST, cv2.CHAIN_APPROX_SIMPLE)

# 绘制轮廓
img_copy = img.copy()
img_draw = cv2.drawContours(img_copy, # 要绘制轮廓的图像
                            contours, # 轮廓的顶点坐标集 列表
                            -1, # 轮廓列表的索引值,-1表示绘制所有轮廓
                            (0, 0, 255),  # 颜色
                            3   # 轮廓线条粗细
                            )

cv2.imshow('image', img)
cv2.imshow('image_draw', img_draw)
cv2.waitKey(0)

drawContours函数代码效果

六、透视变换函数

透视变换是 OpenCV 提供的一种几何变换,用于将图像从一种视角转换为另一种视角。OpenCV 提供了 cv2.getPerspectiveTransform 和 cv2.warpPerspective 两个函数来实现透视变换。

1、功能

①cv2.getPerspectiveTransform:

根据图像的原始四个点坐标(源点)和目标四个点坐标(目标点),计算透视变换矩阵。

②cv2.warpPerspective:

根据透视变换矩阵,对图像进行透视变换,生成新的视角图像。

透视变换通常用于以下场景:

  • 将倾斜或变形的图像矫正为平面视角。
  • 提取图像中的特定区域(如卡片、文档、白板等)。
  • 改变图像的视角以匹配某些特定需求。

2、参数

①cv2.getPerspectiveTransform 的参数

②cv2.warpPerspective 的参数

3、返回值

①cv2.getPerspectiveTransform

返回 3×3 的透视变换矩阵。

②cv2.warpPerspective

返回透视变换后的图像。

4、应用

①图像矫正:

将倾斜的图像矫正为标准平面视角,例如卡片、书本、文档等。

②ROI 提取:

精确提取图像中的特定区域,适用于目标检测或图像分割任务。

③视角匹配:

在 AR 和 3D 应用中,调整图像的视角以匹配其他图像或虚拟场景。

④增强现实:

将二维图像贴合到三维场景中,通过透视变换实现仿真效果。

5、代码示例

python 复制代码
import cv2
import numpy as np

# 1、 读取图像并调整大小
img = cv2.imread("./card.png")
img = cv2.resize(img, (img.shape[1] // 2, img.shape[0] // 2))

# 2、 获取透视变换矩阵
# 原图中的四个点
points1 = np.array([[100, 50], [350, 75], [70, 200], [325, 230]],
                   dtype=np.float32)
# 目标图中的四个点
points2 = np.array([[0, 0], [img.shape[1], 0], [0, img.shape[0]], [img.shape[1], img.shape[0]]],
                   dtype=np.float32)
M = cv2.getPerspectiveTransform(points1, points2)

# 3、透视变换
img_warp = cv2.warpPerspective(img, M, (img.shape[1], img.shape[0]))

cv2.imshow('image', img)
cv2.imshow('image_warp', img_warp)
cv2.waitKey(0)

透视变换函数代码效果

七、举例轮廓的外接边界框,并对比说明

在 OpenCV 中,可以通过 cv2.boundingRect 和 cv2.minAreaRect 方法为轮廓生成外接边界框。两者的功能和应用有所不同:

1. 外接边界框方法

①cv2.boundingRect:

生成一个与轮廓外接的水平矩形。

  • 边界框的边与坐标轴平行。
  • 简单快速,但不能适应旋转的物体。

②cv2.minAreaRect:

生成一个最小面积的旋转矩形。

  • 边界框可以适应物体的方向,能紧贴目标轮廓。
  • 返回矩形的中心点、宽高和旋转角度。

2. 区别对比

| 功能 | 水平外接矩形 (cv2.boundingRect) | 最小面积旋转矩形 (cv2.minAreaRect) |
| 特点 | 水平矩形,边平行于坐标轴 | 最小面积矩形,可旋转以适应物体方向 |
| 适用场景 | 简单场景或对方向无关的分析 | 复杂场景,需要考虑方向的分析 |
| 效率 | 更高 | 相对较低 |

返回值 矩形的左上角坐标和宽高 矩形中心点坐标、宽高和旋转角度

3. 示例代码

以下代码展示如何提取和绘制水平外接矩形和最小面积旋转矩形,并对比效果。

python 复制代码
import cv2
import numpy as np

# 读取图像并调整大小
img = cv2.imread("./outline.png")
img = cv2.resize(img, (img.shape[1] // 2, img.shape[0] // 2))

# 灰度化
img_gray = cv2.cvtColor(img, cv2.COLOR_BGRA2GRAY)
# 二值化
_, img_binary = cv2.threshold(img_gray,
                              127,
                              255,
                              cv2.THRESH_BINARY_INV+cv2.THRESH_OTSU)
# 寻找轮廓
contours, _ = cv2.findContours(img_binary, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)
# 定义轮廓
img_draw = img.copy()


# 给所有轮廓都绘制 外接
for i in contours:
    # 第一种:调用外接矩形函数,获取当前轮廓点的左上角的坐标(x, y) 宽w 高h
    x, y, w, h = cv2.boundingRect(i)
    # 画矩形
    cv2.rectangle(img_draw, [x, y], [x+w, y+h], (0, 255, 0), 2)

    # 第二种:调用最小面积外接矩形函数,获取包含三个元素的元组(中心点坐标、长宽、旋转角度)
    # ((center_x, center_y), (width, height), angle)
    ret = cv2.minAreaRect(i)
    # 调用cv2.boxPoints(ret)可以获取旋转矩阵的四个顶点
    box = np.int32(cv2.boxPoints(ret))
    # 绘制轮廓
    cv2.drawContours(img_draw, [box], -1, (255, 255, 0), 3)


cv2.imshow('image', img)
cv2.imshow('image_draw', img_draw)
cv2.waitKey(0)

水平外接矩形和最小面积旋转矩形对比

4. 输出分析

①Bounding Rectangles(水平外接矩形):

每个目标轮廓都被一个绿色矩形框住。

边界框总是与坐标轴平行,不能很好地适应旋转的目标。

②Min Area Rectangles(最小面积旋转矩形):

每个目标轮廓都被一个蓝色矩形框住。

边界框根据目标的方向自动旋转,紧贴目标,适合复杂场景。

5. 使用建议

①cv2.boundingRect:

简单场景,目标方向较一致时使用,例如:

  • 检测物体大小。
  • 计算水平分布特征。

优势:计算快,简单易用。

②cv2.minAreaRect:

目标方向不一致或需要精确边界时使用,例如:

  • 目标形状分析。
  • 计算旋转目标的特征。

优势:灵活精确,可适应旋转物体。

相关推荐
dal118网工任子仪14 分钟前
66,【6】buuctf web [HarekazeCTF2019]Avatar Uploader 1
笔记·学习
02苏_19 分钟前
2025/1/21 学习Vue的第四天
学习
羊小猪~~42 分钟前
MYSQL学习笔记(四):多表关系、多表查询(交叉连接、内连接、外连接、自连接)、七种JSONS、集合
数据库·笔记·后端·sql·学习·mysql·考研
约定Da于配置1 小时前
uniapp封装websocket
前端·javascript·vue.js·websocket·网络协议·学习·uni-app
东京老树根2 小时前
Excel 技巧15 - 在Excel中抠图头像,换背景色(★★)
笔记·学习·excel
好评笔记3 小时前
AIGC视频生成模型:Stability AI的SVD(Stable Video Diffusion)模型
论文阅读·人工智能·深度学习·机器学习·计算机视觉·面试·aigc
Ronin-Lotus3 小时前
嵌入式硬件篇---ADC模拟-数字转换
笔记·stm32·单片机·嵌入式硬件·学习·低代码·模块测试
算家云3 小时前
TangoFlux 本地部署实用教程:开启无限音频创意脑洞
人工智能·aigc·模型搭建·算家云、·应用社区·tangoflux
编程小猹4 小时前
学习golang语言时遇到的难点语法
学习·golang·xcode
promising-w4 小时前
单片机基础模块学习——数码管
单片机·嵌入式硬件·学习