计算机视觉——OpenCV 使用分水岭算法进行图像分割

分水岭算法

分水岭算法:模拟地理形态的图像分割

分水岭算法通过模拟自然地形来实现图像中物体的分类。在这一过程中,每个像素的灰度值被视作其高度,灰度值较高的像素形成山脊,即分水岭,而二值化阈值则相当于水平面,低于这个水平面的区域会被"淹没"。

测地线距离:地形分析的核心

测地线距离是分水岭算法中的一个关键概念,它代表地球表面两点间的最短路径。这一概念在图论中同样适用,指的是图中两节点间的最短路径,与欧氏距离相比,测地线距离考虑的是实际路径。

分水岭算法的执行步骤

  1. 梯度图像分类:根据灰度值对梯度图像中的像素进行分类,并设定测地距离阈值。
  2. 起始点标记:选择灰度值最小的像素点作为起始点,这些点通常是局部最小值。
  3. 水平面上升:随着阈值的增长,测量周围邻域像素到起始点的测地距离。若小于阈值,则淹没这些像素;若大于阈值,则在这些像素上建立"大坝"。
  4. 大坝设置与区域分区:随着水平面的上升,建立更多的大坝,直到所有区域在分水岭线上相遇,完成图像的分区。

避免过度分割的策略

分水岭算法可能会因噪声或干扰导致图像过度分割,形成过多的小区域。解决这一问题的方法包括:

  • 高斯平滑:通过高斯平滑减少噪声,合并小分区。
  • 基于标记的分水岭算法:选择相对较高的灰度值像素作为起始点,手动标记或使用自动方法如距离变换来确定,从而合并小区域。

OpenCV 实现 Watershed 算法

函数原型:

cpp 复制代码
void watershed( InputArray image, InputOutputArray markers );

参数说明:

  1. image:输入的图像,必须是8位的单通道灰度图像。这个图像的梯度信息将被用来模拟水流向低洼地区流动的过程。

  2. markers:输入输出参数,是一个与原图像大小相同的图像,用于存放分割标记。在函数调用前,这个图像应该被初始化,其中包含了用户定义的分割区域的标记。标记是通过正整数索引来表示的,表示用户已知的前景或背景区域。所有未知区域(即算法需要确定的区域)应该被标记为0。函数执行完成后,每个像素点的标记将被更新为"种子"组件的值,或者在区域边界处被设置为-1。

功能说明:

  • watershed 函数会分析 image 的梯度信息,并使用 markers 中定义的已知区域作为分割的起点(种子点)。
  • 算法将从这些种子点开始,逐步对图像中的其他像素点进行区域归属的判定,直到所有像素点都被标记。
  • 在分割过程中,如果两个相邻的已知区域(种子点)相遇,算法会在它们之间创建一个边界,以避免这些区域合并在一起,从而实现分割。

注意事项:

  • markers 中的标记非常重要,它们直接影响分割的结果。因此,用户需要仔细考虑如何标记已知的前景和背景区域。
  • 分水岭算法可能会导致过度分割,特别是当图像中存在大量噪声时。在实际应用中,可能需要对图像进行预处理,如使用高斯模糊去除小的局部最小值,以减少过度分割的问题。

C++ 代码实现

  1. 读取图像
cpp 复制代码
if(argc < 2){
    std::cerr << "Errorn";
    std::cerr << "Provide Input Image:n<program> <inputimage>\n";
    return -1;
}
cv::Mat original_img = cv::imread(argv[1]);
if(original_img.empty()){
    std::cerr << "Errorn";
    std::cerr << "Cannot Read Imagen";
    return -1;
}
  1. 使用滤波器从图像中去除噪声
    Mean shift blur 是一种保留图像边缘的滤波算法,经常用于在图像 Watershed 分割之前消除噪声,这可以显著改善 Watershed 分割效果。
cpp 复制代码
cv::Mat shifted;
cv::pyrMeanShiftFiltering(original_img, shifted, 21, 51);
showImg("图像滤波", shifted);
  1. 将原始图像转换为灰度和二进制图像
cpp 复制代码
cv::Mat gray_img;
cv::cvtColor(original_img, gray_img, cv::COLOR_BGR2GRAY);
showImg("", gray_img);
cpp 复制代码
cv::Mat bin_img;
cv::threshold(gray_img, bin_img, 0, 255, cv::THRESH_BINARY | cv::THRESH_OTSU);
showImg("二值图像", bin_img);
  1. 查找图像的确定背景

在这一步中,要找到图像中我们确定是背景的区域。

cpp 复制代码
void getBackground(const cv::Mat& source, cv::Mat& dst) {
    cv::dilate(source, dst, cv::Mat::ones(3, 3, CV_8U)); // 3x3 核
}
  1. 查找图像的确定前景

为了找到图像的前景,使用距离变换算法

cpp 复制代码
void getForeground(const cv::Mat& source, cv::Mat& dst) {
    cv::distanceTransform(source, dst, cv::DIST_L2, 3, CV_32F);
    cv::normalize(dst, dst, 0, 1, cv::NORM_MINMAX);
}
  1. 查找标记

在应用 Watershed 算法之前,需要标记。为此,我们将使用 OpenCV 提供的 findContour() 函数来在图像中找到标记。

cpp 复制代码
void findMarker(const cv::Mat& sureBg, cv::Mat& markers, std::vector<std::vector<cv::Point>>& contours) {
    cv::findContours(sureBg, contours, cv::RETR_EXTERNAL, cv::CHAIN_APPROX_SIMPLE);
    // 绘制前景标记
    for (size_t i = 0, size = contours.size(); i < size; i++)
        drawContours(markers, contours, static_cast<int>(i), cv::Scalar(static_cast<int>(i)+1), -1);
}
  1. 应用 Watershed 算法
cpp 复制代码
cv::watershed(original_img, markers);
cv::Mat mark;
markers.convertTo(mark, CV_8U);
cv::bitwise_not(mark, mark); // 将白色转换为黑色,黑色转换为白色
showImg("MARKER", mark);

完整代码

cpp 复制代码
#include <opencv2/imgcodecs.hpp>
#include <opencv2/highgui.hpp>
#include <opencv2/imgproc.hpp>

void showImg(const std::string& windowName, const cv::Mat& img){
    cv::imshow(windowName, img);
}

void getBackground(const cv::Mat& source, cv::Mat& dst) {
    cv::dilate(source, dst, cv::Mat::ones(3, 3, CV_8U)); // 3x3 核
}

void getForeground(const cv::Mat& source, cv::Mat& dst) {
    cv::distanceTransform(source, dst, cv::DIST_L2, 3, CV_32F);
    cv::normalize(dst, dst, 0, 1, cv::NORM_MINMAX);
}

void findMarker(const cv::Mat& sureBg, cv::Mat& markers, std::vector<std::vector<cv::Point>>& contours) {
    cv::findContours(sureBg, contours, cv::RETR_EXTERNAL, cv::CHAIN_APPROX_SIMPLE);
    // 绘制前景标记
    for (size_t i = 0, size = contours.size(); i < size; i++)
        drawContours(markers, contours, static_cast<int>(i), cv::Scalar(static_cast<int>(i)+1), -1);
}

void getRandomColor(std::vector<cv::Vec3b>& colors, size_t size) {
    for (int i = 0; i < size ; ++i) {
        int b = cv::theRNG().uniform(0, 256);
        int g = cv::theRNG().uniform(0, 256);
        int r = cv::theRNG().uniform(0, 256);
        colors.emplace_back(cv::Vec3b((uchar)b, (uchar)g, (uchar)r));
    }
}

int main(int argc, char** argv) {
    if(argc < 2){
        std::cerr << "Errorn";
        std::cerr << "Provide Input Image:n n";
        return -1;
    }
    cv::Mat original_img = cv::imread(argv[1]);
    if(original_img.empty()){
        std::cerr << "Errorn";
        std::cerr << "Cannot Read Imagen";
        return -1;
    }
    cv::Mat shifted;
    cv::pyrMeanShiftFiltering(original_img, shifted, 21, 51);
    showImg("Mean Shifted", shifted);
    cv::Mat gray_img;
    cv::cvtColor(original_img, gray_img, cv::COLOR_BGR2GRAY);
    showImg("GrayIMg", gray_img);
    cv::Mat bin_img;
    cv::threshold(gray_img, bin_img, 0, 255, cv::THRESH_BINARY | cv::THRESH_OTSU);
    showImg("thres img", bin_img);
    cv::Mat sure_bg;
    getBackground(bin_img, sure_bg);
    showImg("Sure Background", sure_bg);
    cv::Mat sure_fg;
    getForeground(bin_img, sure_fg);
    showImg("Sure ForeGround", sure_fg);
    cv::Mat markers = cv::Mat::zeros(sure_bg.size(), CV_32S);
    std::vector<std::vector<cv::Point>> contours;
    findMarker(sure_bg, markers, contours);
    cv::circle(markers, cv::Point(5, 5), 3, cv::Scalar(255), -1); // 在标记周围绘制圆圈
    
    cv::watershed(original_img, markers);
    cv::Mat mark;
    markers.convertTo(mark, CV_8U);
    cv::bitwise_not(mark, mark); // 将白色转换为黑色,黑色转换为白色
    showImg("MARKER", mark);
    // 在图像中突出显示标记 /
    std::vector<cv::Vec3b> colors;
    getRandomColor(colors, contours.size()); // 创建结果图像
    cv::Mat dst = cv::Mat::zeros(markers.size(), CV_8UC3);
    // 用随机颜色填充标记的对象
    for (int i = 0; i < markers.rows; i++)
    {
        for (int j = 0; j < markers.cols; j++)
        {
            int index = markers.at(i,j);
            if (index > 0 && index <= static_cast<int>(contours.size()))
                dst.at<cv::Vec3b>(i,j) = colors[index-1];
        }
    }
    showImg("Final Result", dst);
    cv::waitKey(0);
    return 0;
}
相关推荐
肥猪猪爸27 分钟前
使用卡尔曼滤波器估计pybullet中的机器人位置
数据结构·人工智能·python·算法·机器人·卡尔曼滤波·pybullet
大白要努力!28 分钟前
Android opencv使用Core.hconcat 进行图像拼接
android·opencv
readmancynn39 分钟前
二分基本实现
数据结构·算法
萝卜兽编程41 分钟前
优先级队列
c++·算法
盼海1 小时前
排序算法(四)--快速排序
数据结构·算法·排序算法
一直学习永不止步1 小时前
LeetCode题练习与总结:最长回文串--409
java·数据结构·算法·leetcode·字符串·贪心·哈希表
只怕自己不够好2 小时前
《OpenCV 图像基础操作全解析:从读取到像素处理与 ROI 应用》
人工智能·opencv·计算机视觉
嵌入式大圣2 小时前
嵌入式系统与OpenCV
人工智能·opencv·计算机视觉
Rstln2 小时前
【DP】个人练习-Leetcode-2019. The Score of Students Solving Math Expression
算法·leetcode·职场和发展
芜湖_2 小时前
【山大909算法题】2014-T1
算法·c·单链表