19.OpenCV图像二值化

OpenCV图像二值化

图像二值化(Binarization)是图像预处理中的一种常用技术,其目的是将图像中的像素值分为两个类别------通常是"前景"和"背景"或者说0和255。二值化能够简化图像信息,为后续的形态学处理、边缘检测、目标识别等任务提供基础。本文将介绍二值化的基本概念、全局二值化、三角二值化和自适应二值化的原理与实现

1. 二值化基本概念

二值化将一幅灰度图像中的像素值根据阈值 TT 分为两类:

  • 当像素值大于 TT 时,将其设为最大值(如 255);
  • 当像素值小于或等于 TT 时,将其设为最小值(如 0)。

数学上可以表示为:

g ( x , y ) = { maxValue , if f ( x , y ) > T 0 , if f ( x , y ) ≤ T g(x,y)=\begin{cases}\text{maxValue}, & \text{if } f(x,y) > T \\0, & \text{if } f(x,y) \leq T\end{cases} g(x,y)={maxValue,0,if f(x,y)>Tif f(x,y)≤T

其中f(x,y)为原始图像像素值,g(x,y) 为二值化后的像素值。

2. 全局阈值二值化

全局阈值二值化是最简单的二值化方法,它使用一个固定阈值对整幅图像进行处理。OpenCV 提供了 cv::threshold 函数来实现这一过程。

2.1 cv::threshold 函数

函数原型如下:

cpp 复制代码
double threshold(InputArray src, OutputArray dst, double thresh, double maxval, int type);
  • 返回值 :函数返回所使用的阈值,当使用 THRESH_OTSUTHRESH_TRIANGLE 时,该值为计算出的最佳阈值,否则返回 thresh
  • src:输入灰度图像。
  • dst:输出二值图像。
  • thresh :阈值 TT
  • maxval:当像素值大于阈值时赋予的值(通常为 255)。
  • type
    • THRESH_BINARY:像素值大于阈值时设为最大值,否则设为 0。
    • THRESH_BINARY_INV:像素值大于阈值时设为 0,否则设为最大值。
    • THRESH_TRUNC:像素值大于阈值时设为阈值,否则保持原值。
    • THRESH_TOZERO:像素值大于阈值时保持原值,否则设为 0。
    • THRESH_TOZERO_INV:像素值大于阈值时设为 0,否则保持原值。
    • THRESH_OTSU :自动计算最佳阈值,并使用 THRESH_BINARY 进行二值化。
    • THRESH_TRIANGLE:基于直方图形状分析自动选择阈值,适用于单峰或近似单峰直方图。
cpp 复制代码
#include <opencv2/opencv.hpp>
#include <iostream>
using namespace cv;
using namespace std;

int main() {
    // 读取灰度图像
    Mat gray = imread("E:/image/lena.png", IMREAD_GRAYSCALE);
    if (gray.empty()) {
        cerr << "图像加载失败!" << endl;
        return -1;
    }
    imshow("原图", gray);
    Mat binary;
    // 使用不同阈值类型进行二值化
    threshold(gray, binary, 128, 255, THRESH_BINARY);
    imshow("THRESH_BINARY", binary);

    threshold(gray, binary, 128, 255, THRESH_BINARY_INV);
    imshow("THRESH_BINARY_INV", binary);

    threshold(gray, binary, 128, 255, THRESH_TRUNC);
    imshow("THRESH_TRUNC", binary);

    threshold(gray, binary, 128, 255, THRESH_TOZERO);
    imshow("THRESH_TOZERO", binary);

    threshold(gray, binary, 128, 255, THRESH_TOZERO_INV);
    imshow("THRESH_TOZERO_INV", binary);

    waitKey(0);
    destroyAllWindows();
    return 0;
}

在上述示例中使用了128作为阈值,推荐平均值作为阈值效果会好。我们使用了不同的阈值类型进行二值化,并分别显示了处理后的结果如下图。

3. Otsu's 自动阈值法

当图像的灰度直方图呈双峰分布时,Otsu 自动阈值法可以自动选择最佳阈值,从而实现自适应二值化。使用方法是在 cv::threshold 函数中加入 THRESH_OTSU 标志。

3.1 Otsu 示例代码

cpp 复制代码
#include <opencv2/opencv.hpp>
#include <iostream>
using namespace cv;
using namespace std;

int main() {
    Mat gray = imread("E:/image/lena.png", IMREAD_GRAYSCALE);
    if (gray.empty()) {
        cerr << "图像加载失败!" << endl;
        return -1;
    }

    Mat binary;
    // thresh 参数可以设为 0,Otsu 算法会自动计算最佳阈值
    double otsu_thresh_val = threshold(gray, binary, 0, 255, THRESH_BINARY | THRESH_OTSU);
    cout << "Otsu 自动选择的阈值为:" << otsu_thresh_val << endl;

    imshow("原始灰度图像", gray);
    imshow("Otsu 二值化", binary);
    waitKey(0);
    return 0;
}

4. 三角二值化(Triangle Thresholding)

三角二值化(Triangle Thresholding)是一种基于图像直方图分析的方法,适用于单峰或近似单峰直方图的情况。它使用直方图的形状特征来确定一个合适的阈值。该方法通常用于光照均匀、前景与背景灰度分布明显的图像。不适用于双峰或多峰直方图(例如 Otsu 方法更适用于双峰直方图)

4.1 三角二值化原理

  • 计算图像灰度直方图。
  • 选择直方图中的最大峰值点作为基准点。
  • 计算从直方图起始点到峰值点之间的最大距离来确定阈值。

4.2 三角二值化示例代码

cpp 复制代码
#include <opencv2/opencv.hpp>
#include <iostream>
using namespace cv;
using namespace std;

int main() {
    // 读取灰度图像
    Mat gray = imread("lena.png", IMREAD_GRAYSCALE);
    if (gray.empty()) {
        cerr << "图像加载失败!" << endl;
        return -1;
    }
    
    Mat binary;
    // 使用 Triangle 方法自动计算阈值
    double triangle_thresh_val = threshold(gray, binary, 0, 255, THRESH_BINARY | THRESH_TRIANGLE);
    cout << "三角阈值计算结果:" << triangle_thresh_val << endl;
    
    imshow("原始灰度图像", gray);
    imshow("Triangle 二值化", binary);
    waitKey(0);
    return 0;
}

5. 自适应阈值二值化

在光照不均匀的场景下,全局阈值方法可能效果不佳,此时自适应阈值二值化更为有效。OpenCV 提供了 cv::adaptiveThreshold 函数,根据局部邻域信息动态确定阈值。

5.1 cv::adaptiveThreshold 函数

函数原型如下:

cpp 复制代码
void adaptiveThreshold(InputArray src, OutputArray dst, double maxValue,
                       int adaptiveMethod, int thresholdType, int blockSize, double C);
  • src:输入灰度图像。
  • dst:输出二值图像。
  • maxValue:二值化后像素的最大值(通常为 255)。
  • adaptiveMethod :自适应方法,如 ADAPTIVE_THRESH_MEAN_C (邻域均值)或 ADAPTIVE_THRESH_GAUSSIAN_C(高斯加权)。
  • thresholdType :阈值类型(通常为 THRESH_BINARY)。
  • blockSize:用于计算局部阈值的邻域大小(必须为奇数)。
  • C:从计算出的平均值中减去的常数,起到微调作用。

5.2 自适应阈值示例代码

cpp 复制代码
#include <opencv2/opencv.hpp>
#include <iostream>
using namespace cv;
using namespace std;

int main() {
    Mat gray = imread("E:/image/lena.png", IMREAD_GRAYSCALE);
    if (gray.empty()) {
        cerr << "图像加载失败!" << endl;
        return -1;
    }

    Mat adaptive_binary;
    // 使用自适应阈值,将邻域均值作为局部阈值,blockSize 为 11,C 为 2
    adaptiveThreshold(gray, adaptive_binary, 255, ADAPTIVE_THRESH_MEAN_C, THRESH_BINARY, 11, 2);

    imshow("原始灰度图像", gray);
    imshow("自适应阈值二值化", adaptive_binary);
    waitKey(0);
    return 0;
}

自适应阈值方法通过考虑局部信息,使得在光照不均时也能得到较好的二值化结果,可以看到更多的细节

6. 应用场景与小结

图像二值化是图像预处理的重要步骤,全局阈值、Otsu 自动阈值和自适应阈值各有适用场景。

  • 全局阈值:简单、快速,适用于光照均匀的图像;
  • Otsu 方法:自动计算最佳阈值,适用于双峰直方图;
  • 自适应阈值:针对局部光照不均效果较好。

通过选择合适的方法和参数,可以有效分离图像中的前景与背景,为后续的图像处理和分析任务打下良好基础。

主要应用场景:

  • 文档处理:二值化能将文档转换为黑白图像,有助于 OCR 识别。
  • 目标分割:二值化用于将前景与背景分离,便于后续的物体检测和形态学处理。
  • 图像分析:二值化简化了图像信息,适合形状分析和轮廓提取。
相关推荐
火山引擎开发者社区8 小时前
没有长期记忆,Agent 谈何持续进化?一图看懂火山 Mem0:解锁 Agent 持续学习与进化之路
人工智能
冬奇Lab12 小时前
Workflow 系列(06):安全——跨步骤注入传播与四层防御
人工智能·工作流引擎
冬奇Lab12 小时前
每日一个开源项目(第149篇):RAG-Anything - 把图片、表格、公式当成一等公民的多模态 RAG 框架
人工智能·开源
米小虾12 小时前
AI Agent 安全实战指南:当智能体开始"不听话",开发者该如何应对?
人工智能·安全·agent
IT_陈寒14 小时前
Vite的热更新突然不香了,排查三小时差点砸键盘
前端·人工智能·后端
阿里云大数据AI技术16 小时前
构建高转化海外电商搜索:阿里云OpenSearch行业算法版的全链路智能优化策略实战
人工智能·搜索引擎
Awu122716 小时前
⚡从零开发 Agent CLI(五)实现一个可治理、可扩展的工具系统
前端·人工智能·claude
字节跳动视频云技术团队16 小时前
让 Agent 成为音视频工作台:AI MediaKit CLI + Skill 发布
人工智能·音视频开发
魏祖潇16 小时前
framework 整合实战——DDD/TDD/SDD 三件套在 framework 仓的真实落地
人工智能·后端