OpenCV(三十一):边缘检测Canny

基本原理

Canny 边缘检测是一种经典且常用的图像边缘提取算法,由 John Canny 在 1986 年提出。它在 OpenCV 中得到了高效实现,是结构化光、SLAM、医学影像分析与机器视觉领域中最常用的边缘检测方法之一。其目标是以最优方式识别图像中的边缘,既能准确检测真实边缘,又能保持较强的抗噪能力与定位精度。

Canny 算法之所以经典,是因为它通过数学推导给出了边缘检测的三个最优准则:

  1. 检测率高(Good Detection):尽可能找到真实边缘;
  2. 定位准确(Good Localization):检测到的边缘点应准确落在真实边缘位置;
  3. 一次响应(Minimal Response):相同边缘只产生一条响应,避免多条边缘线。

Canny 算法实现包含 5 个关键步骤:

第一步:噪声抑制(Gaussian Blur)

边缘通常对应灰度变化剧烈的区域,但噪声也会产生剧烈变化。如果不去噪,边缘会出现大量虚假响应。因此 Canny 算法的第一步是使用高斯滤波进行平滑:

复制代码
GaussianBlur(src, blur, Size(3,3), 1.0);

高斯滤波使用如下数学形式的卷积核:

σ 越大,平滑越强,但也会模糊真实边缘。

第二步:计算梯度(Sobel)

Canny 使用 Sobel 算子计算图像在水平方向与垂直方向的梯度:

OpenCV 内部相当于:

cpp 复制代码
Sobel(blur, grad_x, CV_16S, 1, 0);
Sobel(blur, grad_y, CV_16S, 0, 1);

然后得到:

梯度幅值:

梯度方向:

梯度方向说明边缘的方向,梯度越大表示边缘越强。

第三步:非极大值抑制(NMS)

未经处理的梯度图会出现宽厚的边缘带,这不符合 "一次响应" 原则。NMS 的目标是 细化边缘

  1. 根据梯度方向确定像素的比较方向(四种情况:0°、45°、90°、135°)
  2. 当前像素的梯度如果不是局部最大值,则置为 0

这种方法能有效将粗边缩减为优美细线。

第四步:双阈值检测(Double Threshold)

Canny 的创新点之一就是"双阈值",使用高低两个阈值 T1(低)、T2(高):

  • 强边缘:G > T2
  • 弱边缘:T1 < G ≤ T2
  • 非边缘:G ≤ T1

为何要这样做?

  • 边缘是连通的,一个强边缘附近往往会有梯度较弱的像素;
  • 如果只用单阈值,弱边可能被直接丢弃;
  • 双阈值允许保留"可能属于边缘"的弱像素。

第五步:边缘连接(Hysteresis)

弱边缘并不是全部保留,而是需要与强边缘连接才认为是真实边。

过程如下:

  1. 对所有强边缘保留;
  2. 对弱边缘,若与强边相邻(8 连接),则保留;
  3. 其他弱边缘舍弃。

最终得到干净、连续、不重复的边缘线。

OpenCV 中的 Canny 函数

OpenCV 在 Python 中提供的 Canny 边缘检测函数原型如下:

python 复制代码
cv2.Canny(image, threshold1, threshold2, edges=None, apertureSize=3, L2gradient=False)

1. image(输入图像)

  • 类型:uint8 单通道(灰度图)
  • 说明:如果传入的是彩色图,OpenCV 不会报错,但会自动将像素分量混合,使结果不可控。

建议永远手动转换为灰度图:

复制代码
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

2. threshold1(低阈值)

  • 用于双阈值检测中的"弱边缘"判断。
  • 越低 → 保留越多弱边缘(噪声也更多)
  • 越高 → 结果越干净,但容易漏掉细节边缘

一般经验:

复制代码
low = 0.66 * 中位数

3. threshold2(高阈值)

  • 用于判定"强边缘"
  • 边缘必须 > threshold2 才能直接保留为强边

常用经验规则:

复制代码
threshold2 ≈ 2 × threshold1

建议:

  • 图像干净 → 高阈值可放宽
  • 图像噪声大 → 高阈值应提高

4. edges(输出图像,可忽略)

一般不需要传入,由 OpenCV 创建:

复制代码
edges = cv2.Canny(image, 50, 150)

5. apertureSize(Sobel 算子卷积核尺寸)

  • 默认值:3
  • 可选:3, 5, 7

它决定了梯度计算的卷积核大小(Sobel 算子大小),影响梯度平滑程度。

apertureSize 特点
3 默认,精度好
5 边缘更平滑,适合噪声较大图像
7 更强的平滑,适合强噪声环境

6. L2gradient(梯度幅值计算方式)

  • 默认:False
  • 控制梯度幅值计算方法:

False(默认)

使用简单加和:

速度较快,在多数应用中足够。

True

使用更准确的欧几里得距离:

更精确但计算更慢。

如果你对边缘精度要求高,应启用 L2gradient:

python 复制代码
edges = cv2.Canny(gray, 50, 150, L2gradient=True)

示例

python 复制代码
import cv2
import numpy as np

# 1. 读取图像
img = cv2.imread("test.jpg")

# 检查是否读取成功
if img is None:
    raise FileNotFoundError("无法找到图像,请检查路径 test.jpg 是否存在!")

# 2. 转灰度图
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

# 3. 高斯滤波(Canny 内部也会处理,但建议手动提高效果)
blur = cv2.GaussianBlur(gray, (3, 3), 1)

# 4. 设置 Canny 双阈值
low_threshold = 50
high_threshold = 150

# 5. 执行 Canny 边缘检测
edges = cv2.Canny(
    blur,
    low_threshold,
    high_threshold,
    apertureSize=3,
    L2gradient=True  # 使用更精确的梯度计算
)

# 6. 显示结果
cv2.imshow("Original", img)
cv2.imshow("Gray", gray)
cv2.imshow("Canny Edges", edges)
cv2.waitKey(0)
cv2.destroyAllWindows()

执行效果:

相关推荐
风象南1 小时前
普通人用AI加持赚到的第一个100块
人工智能·后端
牛奶2 小时前
2026年大模型怎么选?前端人实用对比
前端·人工智能·ai编程
牛奶2 小时前
前端人为什么要学AI?
前端·人工智能·ai编程
罗西的思考5 小时前
AI Agent框架探秘:拆解 OpenHands(10)--- Runtime
人工智能·算法·机器学习
冬奇Lab5 小时前
OpenClaw 源码精读(2):Channel & Routing——一条消息如何找到它的 Agent?
人工智能·开源·源码阅读
冬奇Lab5 小时前
一天一个开源项目(第38篇):Claude Code Telegram - 用 Telegram 远程用 Claude Code,随时随地聊项目
人工智能·开源·资讯
格砸7 小时前
从入门到辞职|从ChatGPT到OpenClaw,跟上智能时代的进化
前端·人工智能·后端
可观测性用观测云7 小时前
可观测性 4.0:教系统如何思考
人工智能
sunny8657 小时前
Claude Code 跨会话上下文恢复:从 8 次纠正到 0 次的工程实践
人工智能·开源·github
小笼包包仔7 小时前
OpenClaw 多Agent软件开发最佳实践指南
人工智能