OpenCV中的分水岭算法 (C/C++)

OpenCV中的分水岭算法 (C/C++) 🏞️

分水岭算法 (Watershed Algorithm) 是一种在图像处理和计算机视觉中广泛应用的图像分割方法。它特别适用于分离图像中相互接触或重叠的对象。其基本思想是将灰度图像看作一个地形景观,其中灰度值代表海拔高度。算法模拟从用户定义的标记点("种子点")开始向"盆地"注水的过程,当不同盆地的水汇合时,便形成了"分水岭线",这些线就是对象的边界。


1. 算法原理简介

想象一下,一个地形表面被水淹没,水从代表不同区域的标记(局部最小值)开始上升。当来自不同标记的水相遇时,就在它们之间建立一道屏障(分水岭)。最终,这些屏障就勾勒出分割区域的轮廓。

直接将分水岭算法应用于梯度图像通常会导致过度分割 (over-segmentation) ,因为噪声和微小的局部梯度变化会产生许多不必要的集水盆。为了解决这个问题,通常采用基于标记 (marker-based) 的分水岭算法。用户(或通过其他算法)预先定义一些标记,这些标记代表了:

  • 确定是前景的区域 (Sure Foreground)
  • 确定是背景的区域 (Sure Background)
  • 其他区域则标记为未知

算法将仅从这些标记开始淹没,从而大大减少过度分割。


2. OpenCV中的 cv::watershed

OpenCV 提供了 cv::watershed 函数来实现基于标记的分水岭算法。

函数原型:

cpp 复制代码
void cv::watershed(
    cv::InputArray image,     // 输入图像,必须是8位3通道彩色图像 (CV_8UC3)
    cv::InputOutputArray markers // 输入/输出标记图像。它应该是一个32位单通道整数图像 (CV_32SC1)。
                               // 在输入时,它包含预定义的标记。
                               // 在输出时,它被修改为分割结果,其中分水岭线被标记为 -1。
);

markers 图像详解:

  • 在输入 markers 图像时,不同的区域需要用不同的正整数标记:
    • 0:表示未知区域,这些区域将由算法决定其归属。
    • 1:通常用于标记确定的背景区域。
    • >1 (如 2, 3, ...)`:用于标记不同的确定前景对象区域。每个对象一个唯一的正整数。
  • 在函数执行后,markers 图像会被修改:
    • 属于特定标记区域的像素会被赋予该标记的值。
    • 分水岭线(边界)上的像素会被标记为 -1

3. 典型工作流程与C++实现步骤

使用分水岭算法进行图像分割通常遵循以下步骤:

  1. 加载图像 :读取源图像。确保它是或可以转换为 CV_8UC3 格式。
  2. 预处理与标记生成 :这是最关键的一步。
    • 灰度化与二值化 :将图像转换为灰度图,然后通常使用阈值法(如 cv::threshold 配合 cv::THRESH_OTSU)得到二值图像,以初步分离前景和背景。
    • 去除噪声(确定背景) :对二值图像进行形态学开运算 (cv::morphologyExcv::MORPH_OPEN) 去除小的噪声点。然后进行形态学膨胀 (cv::dilate),得到的区域可以认为是确定的背景 (Sure Background)。
    • 寻找确定前景
      • 使用距离变换 (cv::distanceTransform) 计算二值图像中每个前景像素到最近背景像素的距离。
      • 对距离变换的结果进行阈值处理,得到一些可以认为是确定的前景 (Sure Foreground) 的区域。这些区域通常是对象的"核心"。
    • 标记未知区域:将确定背景和确定前景之外的区域标记为未知。
    • 创建 markers 图像 :根据上述确定的前景、背景区域,初始化一个 CV_32SC1 类型的 markers 图像。可以使用 cv::connectedComponents 对确定前景区域进行连通组件分析,为每个组件分配一个唯一的标签。
  3. 应用分水岭算法 :调用 cv::watershed(image, markers);
  4. 可视化结果 :遍历修改后的 markers 图像,将分水岭线(值为 -1 的像素)在原图上用醒目的颜色标出。

示例代码:

cpp 复制代码
#include <opencv2/opencv.hpp>
#include <iostream>
#include <vector>

int main() {
    // 1. 加载图像
    cv::Mat src = cv::imread("your_image_with_touching_objects.png");
    if (src.empty()) {
        std::cerr << "Error: Could not load image." << std::endl;
        return -1;
    }
    cv::imshow("Source Image", src);

    // --- 2. 预处理与标记生成 ---
    cv::Mat gray, binary;
    cv::cvtColor(src, gray, cv::COLOR_BGR2GRAY);
    // 使用Otsu二值化
    cv::threshold(gray, binary, 0, 255, cv::THRESH_BINARY_INV + cv::THRESH_OTSU);
    cv::imshow("Binary Image", binary);

    // 去除噪声 (形态学开运算)
    cv::Mat kernel = cv::getStructuringElement(cv::MORPH_RECT, cv::Size(3, 3));
    cv::Mat opening;
    cv::morphologyEx(binary, opening, cv::MORPH_OPEN, kernel, cv::Point(-1, -1), 2);
    cv::imshow("Opening (Noise Removal)", opening);

    // 确定背景区域 (膨胀)
    cv::Mat sure_bg;
    cv::dilate(opening, sure_bg, kernel, cv::Point(-1, -1), 3);
    cv::imshow("Sure Background", sure_bg);

    // 确定前景区域 (距离变换 + 阈值)
    cv::Mat dist_transform;
    cv::distanceTransform(opening, dist_transform, cv::DIST_L2, 5);
    cv::normalize(dist_transform, dist_transform, 0, 1.0, cv::NORM_MINMAX); // 归一化到0-1
    cv::imshow("Distance Transform", dist_transform * 255); // 可视化时乘以255

    cv::Mat sure_fg;
    double minVal, maxVal;
    cv::minMaxLoc(dist_transform, &minVal, &maxVal);
    cv::threshold(dist_transform, sure_fg, maxVal * 0.6, 255, cv::THRESH_BINARY); // 阈值可调
    sure_fg.convertTo(sure_fg, CV_8U);
    cv::imshow("Sure Foreground", sure_fg);

    // 寻找未知区域 (背景 - 前景)
    cv::Mat unknown;
    cv::subtract(sure_bg, sure_fg, unknown);
    cv::imshow("Unknown Region", unknown);

    // 创建 markers 图像
    cv::Mat markers;
    cv::connectedComponents(sure_fg, markers); // 连通组件标记前景

    // 将背景标记为1 (OpenCV中通常将背景标记为1,前景从2开始)
    // connectedComponents 会将背景标记为0,所以我们需要调整
    for (int i = 0; i < markers.rows; i++) {
        for (int j = 0; j < markers.cols; j++) {
            markers.at<int>(i, j) = markers.at<int>(i, j) + 1; // 确保前景标记从2开始
            if (sure_bg.at<uchar>(i, j) == 0) { // 如果是原始二值图中的背景(黑色),则认为是未知区域
                markers.at<int>(i, j) = 0;     // 标记为未知
            }
            if (sure_bg.at<uchar>(i, j) == 255 && sure_fg.at<uchar>(i, j) == 0) { // 膨胀后的背景,且不是前景
                 markers.at<int>(i, j) = 1;    // 标记为确定背景
            }
        }
    }
    // 对于之前通过 `subtract` 得到的 `unknown` 区域,如果其像素值为255(表示这部分在sure_bg中但不在sure_fg中),
    // 且我们想确保它被算法处理(而不是固定为背景1),可以将其在markers中标记为0。
    // 但通常,将 `sure_bg` 减去 `sure_fg` 得到的区域作为 `unknown` 并在 `markers` 中标记为0更直接。
    // 此处已通过上一步骤的条件判断(`sure_bg.at<uchar>(i, j) == 0`)来处理了部分未知区域。
    //更精细的 `markers` 创建:
    // 1. 背景标记为1
    // 2. 前景用 `connectedComponents` 标记为 2, 3, ...
    // 3. `sure_bg` 中是背景但 `sure_fg` 中不是前景的区域,标记为1 (已在循环中完成)
    // 4. `unknown` 区域 (即 `sure_bg` 和 `sure_fg` 之间的模糊地带) 标记为0 (已在循环中完成)

    // --- 3. 应用分水岭算法 ---
    cv::watershed(src, markers); // src必须是CV_8UC3

    // --- 4. 可视化结果 ---
    // 将分水岭线 (-1) 标记为红色
    for (int i = 0; i < markers.rows; i++) {
        for (int j = 0; j < markers.cols; j++) {
            if (markers.at<int>(i, j) == -1) {
                src.at<cv::Vec3b>(i, j) = cv::Vec3b(0, 0, 255); // 红色
            }
        }
    }

    cv::imshow("Segmented (Watershed lines)", src);
    cv::waitKey(0);
    return 0;
}

注意: 上述代码中的参数(如形态学操作的迭代次数、距离变换后的阈值等)需要根据具体图像进行仔细调整。


4. 关键考量与技巧 ⚙️

  • 标记的质量至关重要:分水岭算法的成功在很大程度上取决于初始标记的准确性。不好的标记会导致分割不佳。
  • 避免过度分割:基于标记的分水岭是避免过度分割的主要手段。如果直接对梯度图像应用,几乎肯定会得到大量无用的小区域。
  • 输入图像类型cv::watershed 要求输入图像 imageCV_8UC3 (8位3通道彩色图),markers 图像是 CV_32SC1 (32位单通道整数图)。
  • 参数调整:预处理步骤中的参数(如形态学核的大小、阈值、膨胀/腐蚀次数)需要根据待分割对象的特性进行实验和调整。
  • 连通组件分析cv::connectedComponents 是生成前景对象独立标记的有效工具。

5. 总结 ✨

OpenCV 中的分水岭算法是一种强大的图像分割工具,尤其擅长分离接触或重叠的对象。其核心在于通过精心设计的预处理步骤生成准确的前景和背景标记,然后利用这些标记引导分割过程。虽然参数调整可能需要一些经验,但一旦掌握,它就能在许多复杂的分割任务中发挥巨大作用。

相关推荐
?!71434 分钟前
算法打卡第11天
数据结构·c++·算法·哈希算法
?!7143 小时前
Socket编程之TCP套件字
linux·网络·c++·网络协议·tcp/ip
小指纹5 小时前
2025山东CCPC题解
c++·算法
技术程序猿华锋6 小时前
Void:免费且隐私友好的 AI 编码利器,挑战 Cursor 地位?
c++·人工智能·mfc
倔强的石头1066 小时前
【C++指南】C++ list容器完全解读(二):list模拟实现,底层架构揭秘
c++·架构·list
木子.李3479 小时前
数据结构-算法学习C++(入门)
数据库·c++·学习·算法
半青年10 小时前
IEC61850规约客户端软件开发实战(第二章)
java·c++·qt·网络协议·c#·信息与通信·iec61850
moz与京10 小时前
【数据结构】字符串操作整理(C++)
开发语言·数据结构·c++
linff91112 小时前
Reactor和Proactor
c++·网络编程’
末日汐12 小时前
STL-list
开发语言·c++