边缘检测：基础算子到高级边缘提取【计算机视觉】

[边缘检测（Edge Detection）](#边缘检测（Edge Detection）)
- Ⅰ、引言
- Ⅱ、边缘检测的数学基础
- - 一、图像的数学表示
  - 二、边缘的数学定义（微分的直接应用）
  - - [1. 一维连续信号的边缘](#1. 一维连续信号的边缘)
    - [2. 二维连续图像的边缘](#2. 二维连续图像的边缘)
  - 三、从微分到差分（关键步骤）
  - - [1. 一阶微分的离散近似（核心）](#1. 一阶微分的离散近似（核心）)
    - [2. 二阶微分的离散近似](#2. 二阶微分的离散近似)
  - 四、从差分走向卷积（为什么所有算子都用卷积？）
  - - [1. 一阶微分 → 差分 → 卷积核](#1. 一阶微分 → 差分 → 卷积核)
    - [2. 二阶微分 → 二阶差分 → 卷积核](#2. 二阶微分 → 二阶差分 → 卷积核)
  - 五、梯度与边缘检测（微分的最终应用）
  - 六、二阶微分与边缘检测（Laplacian）
- Ⅲ、基于梯度的一阶算子
- - [一、Roberts 算子](#一、Roberts 算子)
  - - [1. 数学逻辑](#1. 数学逻辑)
    - - （1）数学公式
      - （2）例题
    - 结论
    - [2. 代码实现](#2. 代码实现)
  - [二、Prewitt / Sobel 算子（合并讲解）](#二、Prewitt / Sobel 算子（合并讲解）)
  - - [1. 数学逻辑](#1. 数学逻辑)
    - - （1）数学公式
      - [（2）例题（Prewitt 与 Sobel 对比）](#（2）例题（Prewitt 与 Sobel 对比）)
      - [① Prewitt 计算](#① Prewitt 计算)
        
        [② Sobel 计算](#② Sobel 计算)
    - 结论
    - [2.Roberts、Prewitt、Sobel 边缘检测算子对比实验总结](#2.Roberts、Prewitt、Sobel 边缘检测算子对比实验总结)
- [Ⅳ、Laplacian 算子（基于梯度的二阶算子）](#Ⅳ、Laplacian 算子（基于梯度的二阶算子）)
- - 一、数学逻辑
  - - [1. 数学公式](#1. 数学公式)
    - [2. 把离散公式写成卷积核（得到模板）](#2. 把离散公式写成卷积核（得到模板）)
    - [3. 例题](#3. 例题)
  - 二、代码实现
  - 三、对Laplacian算子与一阶算子的总结
- Ⅴ、Canny边缘检测
- - 一、Canny算法的数学本质
  - 二、核心步骤的数学公式与推导
  - - [1. 高斯滤波（噪声抑制）](#1. 高斯滤波（噪声抑制）)
    - - （1）高斯核数学表达式
      - （2）平滑图像计算
    - [2. 一阶梯度计算（边缘强度与方向）](#2. 一阶梯度计算（边缘强度与方向）)
    - [3. 非极大值抑制（边缘细化）](#3. 非极大值抑制（边缘细化）)
    - - （1）核心规则
      - （2）方向匹配的邻域选取（4方向示例）
    - [4. 双阈值判决（边缘连接与噪声剔除）](#4. 双阈值判决（边缘连接与噪声剔除）)
  - 三、单像素邻域的Canny边缘检测计算
  - - [1. 计算x/y方向梯度（Sobel核卷积）](#1. 计算x/y方向梯度（Sobel核卷积）)
    - [2. 计算梯度大小与梯度方向](#2. 计算梯度大小与梯度方向)
    - [3. 非极大值抑制（边缘细化）](#3. 非极大值抑制（边缘细化）)
    - [4. 双阈值判决（最终边缘判定）](#4. 双阈值判决（最终边缘判定）)
  - 四、代码实现
  - 五、cv2.Canny()函数
  - - - [1. 函数原型](#1. 函数原型)
      - [2. 核心参数说明](#2. 核心参数说明)
      - [3. 关键注意事项](#3. 关键注意事项)
  - [六、Canny 与 Sobel 边缘检测对比](#六、Canny 与 Sobel 边缘检测对比)
- Ⅵ、总结
- - 上一章

边缘检测（Edge Detection）

边缘检测是让计算机"看见"物体轮廓的核心技术，也是入门计算机视觉的第一步。

注意：本文所有代码均可导入 Jupyter Notebook 直接运行

Ⅰ、引言

简单来说，边缘检测就是在图像里找"边界线"------比如从一张照片里抠出杯子、书本的轮廓。

先认识5种最常用的边缘检测工具，难度从易到难：

算法名称	核心特点（小白版）	定位
Roberts 算子	最简单的找边方法，易受噪点干扰	入门
Prewitt 算子	比Roberts稳一点的基础找边法	入门
Sobel 算子	实际应用最多的基础找边工具	常用
Laplacian 算子	找更细的边缘，但怕噪点	进阶
Canny 算法	找边最精准的"全能选手"	高级

这5种方法覆盖了从"随手找边"到"精准找边"的全场景，接下来我们逐个拆解～

Ⅱ、边缘检测的数学基础

一、图像的数学表示

图像在数学上是一个二维离散函数： f ( x , y ) f(x, y) f(x,y)

其中：

x , y x, y x,y 为像素坐标（离散）
f ( x , y ) f(x, y) f(x,y) 为灰度值（离散）

但数学中的微分、导数是针对连续函数定义的，因此我们需要先把图像看作连续函数，再讨论如何离散化。

二、边缘的数学定义（微分的直接应用）

边缘 = 灰度值剧烈变化的位置。

数学上，"变化剧烈"用导数描述。

1. 一维连续信号的边缘

对连续函数 f ( x ) f(x) f(x)：

一阶导数大 → 变化快 → 可能是边缘
二阶导数过零点 → 变化率由正变负 → 精确边缘位置

即：

边缘位置 ≈ 一阶导数极大值

边缘位置 = 二阶导数过零点

这是边缘检测的数学起点。

2. 二维连续图像的边缘

图像是二维函数 f ( x , y ) f(x, y) f(x,y)，变化率由偏导数描述：

∂ f ∂ x , ∂ f ∂ y \frac{\partial f}{\partial x}, \quad \frac{\partial f}{\partial y} ∂x∂f,∂y∂f

这两个偏导数组成梯度向量：

∇ f = ( ∂ f ∂ x , ∂ f ∂ y ) \nabla f = \left( \frac{\partial f}{\partial x}, \frac{\partial f}{\partial y} \right) ∇f=(∂x∂f,∂y∂f)

梯度的大小表示变化强度：

∥ ∇ f ∥ = ( ∂ f ∂ x ) 2 + ( ∂ f ∂ y ) 2 \|\nabla f\| = \sqrt{\left(\frac{\partial f}{\partial x}\right)^2 + \left(\frac{\partial f}{\partial y}\right)^2} ∥∇f∥=(∂x∂f)2+(∂y∂f)2

梯度方向指向变化最快的方向。

所以：边缘 = 梯度大的地方。

这是所有一阶边缘检测算子的数学基础。

三、从微分到差分（关键步骤）

图像是离散的，无法直接计算连续导数，因此需要用差分近似微分。

1. 一阶微分的离散近似（核心）

连续形式：

d f d x = lim ⁡ h → 0 f ( x + h ) − f ( x ) h \frac{df}{dx} = \lim_{h \to 0} \frac{f(x+h) - f(x)}{h} dxdf=h→0limhf(x+h)−f(x)

离散图像中 h = 1 h=1 h=1（像素间距），因此：

d f d x ≈ f ( x + 1 ) − f ( x ) \frac{df}{dx} \approx f(x+1) - f(x) dxdf≈f(x+1)−f(x)

这就是前向差分。

同理：

∂ f ∂ x ≈ f ( x + 1 , y ) − f ( x , y ) \frac{\partial f}{\partial x} \approx f(x+1, y) - f(x, y) ∂x∂f≈f(x+1,y)−f(x,y)
∂ f ∂ y ≈ f ( x , y + 1 ) − f ( x , y ) \frac{\partial f}{\partial y} \approx f(x, y+1) - f(x, y) ∂y∂f≈f(x,y+1)−f(x,y)

这是所有一阶算子（Roberts、Prewitt、Sobel）的根本来源。

2. 二阶微分的离散近似

连续形式：

d 2 f d x 2 = lim ⁡ h → 0 f ( x + h ) − 2 f ( x ) + f ( x − h ) h 2 \frac{d^2f}{dx^2} = \lim_{h \to 0} \frac{f(x+h) - 2f(x) + f(x-h)}{h^2} dx2d2f=h→0limh2f(x+h)−2f(x)+f(x−h)

离散化（ h = 1 h=1 h=1）：

d 2 f d x 2 ≈ f ( x + 1 ) − 2 f ( x ) + f ( x − 1 ) \frac{d^2f}{dx^2} \approx f(x+1) - 2f(x) + f(x-1) dx2d2f≈f(x+1)−2f(x)+f(x−1)

这就是 Laplacian 的数学基础。

四、从差分走向卷积（为什么所有算子都用卷积？）

差分是线性运算，而线性运算在离散信号处理中可以表示为卷积。

例如一维一阶差分：

f ( x + 1 ) − f ( x ) = f ( x ) ∗ [ − 1 , 1 ] f(x+1) - f(x) = f(x) * [-1, 1] f(x+1)−f(x)=f(x)∗[−1,1]

二维图像的差分同样可以写成卷积核。

1. 一阶微分 → 差分 → 卷积核

例如 x 方向一阶差分：

∂ f ∂ x ≈ f ( x + 1 , y ) − f ( x − 1 , y ) \frac{\partial f}{\partial x} \approx f(x+1,y) - f(x-1,y) ∂x∂f≈f(x+1,y)−f(x−1,y)

对应的卷积核：

− 1 0 1 \] \\begin{bmatrix} -1 \& 0 \& 1 \\end{bmatrix} \[−101

这正是 Prewitt/Sobel 的基础。

2. 二阶微分 → 二阶差分 → 卷积核

x 方向二阶差分：

∂ 2 f ∂ x 2 ≈ f ( x + 1 ) − 2 f ( x ) + f ( x − 1 ) \frac{\partial^2 f}{\partial x^2} \approx f(x+1) - 2f(x) + f(x-1) ∂x2∂2f≈f(x+1)−2f(x)+f(x−1)

对应的卷积核：

1 − 2 1 \] \\begin{bmatrix} 1 \& -2 \& 1 \\end{bmatrix} \[1−21

扩展到二维得到 Laplacian：

0 1 0 1 − 4 1 0 1 0 \] \\begin{bmatrix} 0 \& 1 \& 0 \\\\ 1 \& -4 \& 1 \\\\ 0 \& 1 \& 0 \\end{bmatrix} 0101−41010 *** ** * ** *** #### 五、梯度与边缘检测（微分的最终应用） 所有一阶算子都在计算梯度： ∇ f = ( ∂ f ∂ x , ∂ f ∂ y ) \\nabla f = \\left( \\frac{\\partial f}{\\partial x}, \\frac{\\partial f}{\\partial y} \\right) ∇f=(∂x∂f,∂y∂f) 边缘强度： E = G x 2 + G y 2 E = \\sqrt{G_x\^2 + G_y\^2} E=Gx2+Gy2 其中： * G x G_x Gx 是 x 方向卷积结果（近似 ∂f/∂x） * G y G_y Gy 是 y 方向卷积结果（近似 ∂f/∂y） 这就是为什么一阶算子要用卷积： **卷积 = 离散化的微分运算。** *** ** * ** *** #### 六、二阶微分与边缘检测（Laplacian） 二阶微分检测边缘的依据是： * 一阶微分极大值 → 二阶微分过零点 因此： ∇ 2 f = 0 \\nabla\^2 f = 0 ∇2f=0的位置就是边缘。 Laplacian 的卷积核正是二阶差分的离散形式。 *** ** * ** *** ### Ⅲ、基于梯度的一阶算子 #### 一、Roberts 算子 ##### 1. 数学逻辑 ###### （1）数学公式 用 2×2 大小的"小格子"计算图像灰度的差异，差异大的地方就是边缘。 * 把图像看成无数个像素点，每个点有个"灰度值"（0=黑，255=白）； * 用两个 2×2 模板（卷积核）分别算**水平+对角线** 、**垂直+对角线** 的灰度差： * 模板1（Gx）： \[ 1 0 0 − 1 \] \\begin{bmatrix} 1 \& 0 \\\\ 0 \& -1 \\end{bmatrix} \[100−1\] （算右下-左上的差） * 模板2（Gy）： \[ 0 1 − 1 0 \] \\begin{bmatrix} 0 \& 1 \\\\ -1 \& 0 \\end{bmatrix} \[0−110\] （算右上-左下的差） * 最终边缘强度 = G x 2 + G y 2 \\sqrt{Gx\^2 + Gy\^2} Gx2+Gy2 （简单理解：把两个方向的差异"合并"） 就像数方格，用相邻4个点的灰度相减，差越大越像边缘，缺点是太敏感，一点点噪点都会误判。 ###### （2）例题 假设有一个 2×2 的图像像素块（每个数值为像素灰度值，范围 0-255）： \[ 100 120 110 130 \] \\begin{bmatrix} 100 \& 120 \\\\ 110 \& 130 \\end{bmatrix} \[100110120130\]使用 Roberts 算子计算该区域的边缘强度。 * 步骤1：计算 Gx（右下-左上方向灰度差） Roberts 算子 Gx 模板： G x = \[ 1 0 0 − 1 \] Gx = \\begin{bmatrix} 1 \& 0 \\\\ 0 \& -1 \\end{bmatrix} Gx=\[100−1

计算逻辑：像素点 × 模板对应位置数值，再求和
G x = ( 100 × 1 ) + ( 120 × 0 ) + ( 110 × 0 ) + ( 130 × − 1 ) = 100 − 130 = − 30 Gx = (100×1) + (120×0) + (110×0) + (130×-1) = 100 - 130 = -30 Gx=(100×1)+(120×0)+(110×0)+(130×−1)=100−130=−30

步骤2：计算 Gy（右上-左下方向灰度差）

Roberts 算子 Gy 模板：
G y = [ 0 1 − 1 0 ] Gy = \begin{bmatrix} 0 & 1 \\ -1 & 0 \end{bmatrix} Gy=[0−110]

计算逻辑：像素点 × 模板对应位置数值，再求和
G y = ( 100 × 0 ) + ( 120 × 1 ) + ( 110 × − 1 ) + ( 130 × 0 ) = 120 − 110 = 10 Gy = (100×0) + (120×1) + (110×-1) + (130×0) = 120 - 110 = 10 Gy=(100×0)+(120×1)+(110×−1)+(130×0)=120−110=10
步骤3：计算最终边缘强度

边缘强度公式（勾股定理合并两个方向的差异）：
边缘强度 = G x 2 + G y 2 \text{边缘强度} = \sqrt{Gx^2 + Gy^2} 边缘强度=Gx2+Gy2

代入数值计算：
边缘强度 = ( − 30 ) 2 + 10 2 = 900 + 100 = 1000 ≈ 31.62 \text{边缘强度} = \sqrt{(-30)^2 + 10^2} = \sqrt{900 + 100} = \sqrt{1000} ≈ 31.62 边缘强度=(−30)2+102 =900+100 =1000 ≈31.62

结论

该 2×2 像素区域的边缘强度约为 31.62，数值越大代表该位置的边缘越明显。

2. 代码实现

python 复制代码

import cv2
import numpy as np
import matplotlib.pyplot as plt

plt.rcParams['font.sans-serif'] = ['SimHei']
plt.rcParams['axes.unicode_minus'] = False

img = cv2.imread('test.jpg', cv2.IMREAD_GRAYSCALE)
if img is None:
    img = np.random.randint(0, 255, (500, 500), dtype=np.uint8)

python 复制代码

kernel_x = np.array([[1, 0], [0, -1]], dtype=np.float32)
kernel_y = np.array([[0, 1], [-1, 0]], dtype=np.float32)
gx = cv2.filter2D(img, cv2.CV_64F, kernel_x)
gy = cv2.filter2D(img, cv2.CV_64F, kernel_y)
edge_strength = np.sqrt(gx**2 + gy**2)
edge_strength = cv2.normalize(edge_strength, None, 0, 255, cv2.NORM_MINMAX).astype(np.uint8)

先定义 Roberts 算子 X（右下 - 左上）、Y（右上 - 左下）两个方向的 2×2 检测模板（卷积核）
通过cv2.filter2D用 64 位浮点型精度对整张图像做卷积计算，得到每个像素点两个方向的灰度差值（gx、gy）
再利用勾股定理（np.sqrt(gx**2 + gy**2)）合并两个方向的差值，得到像素的边缘强度
最后通过cv2.normalize将边缘强度值归一化到图像显示的 0-255 范围，并转为 8 位无符号整数，确保边缘检测结果能正常可视化。

python 复制代码

plt.figure(figsize=(10, 5))
plt.subplot(1, 2, 1)
plt.imshow(img, cmap='gray')
plt.title('原图')
plt.axis('off')
plt.subplot(1, 2, 2)
plt.imshow(edge_strength, cmap='gray')
plt.title('Roberts算子边缘检测')
plt.axis('off')
plt.show()

二、Prewitt / Sobel 算子（合并讲解）

1. 数学逻辑

（1）数学公式

Prewitt 和 Sobel 都是用 3×3 模板计算图像的水平和垂直灰度差，区别仅在于：
Sobel 给中间行/列的像素加了权重 2，让中心像素更重要。

两者的模板可以统一写成：

算子	水平模板 Gx（检测垂直边缘）	垂直模板 Gy（检测水平边缘）
Prewitt	[ − 1 0 1 − 1 0 1 − 1 0 1 ] \begin{bmatrix} -1 & 0 & 1 \\ -1 & 0 & 1 \\ -1 & 0 & 1 \end{bmatrix} −1−1−1000111	[ − 1 − 1 − 1 0 0 0 1 1 1 ] \begin{bmatrix} -1 & -1 & -1 \\ 0 & 0 & 0 \\ 1 & 1 & 1 \end{bmatrix} −101−101−101
Sobel	[ − 1 0 1 − 2 0 2 − 1 0 1 ] \begin{bmatrix} -1 & 0 & 1 \\ -2 & 0 & 2 \\ -1 & 0 & 1 \end{bmatrix} −1−2−1000121	[ − 1 − 2 − 1 0 0 0 1 2 1 ] \begin{bmatrix} -1 & -2 & -1 \\ 0 & 0 & 0 \\ 1 & 2 & 1 \end{bmatrix} −101−202−101

计算方式完全相同：

Gx = 模板与图像 3×3 区域的卷积
Gy = 模板与图像 3×3 区域的卷积
最终边缘强度 = G x 2 + G y 2 \sqrt{Gx^2 + Gy^2} Gx2+Gy2

可以理解为：

Prewitt：所有像素"一人一票"，平均计算灰度差
Sobel：中间像素"两票"，更重视中心，更准确、更抗噪

（2）例题（Prewitt 与 Sobel 对比）

使用同一个 3×3 像素块：