图像处理 | 图像二值化

在图像处理领域，图像二值化是一个重要的操作，它将彩色或灰度图像转换为只有两种颜色（通常是黑白）的图像。二值化广泛应用于文字识别、图像分割、边缘检测等领域，尤其在处理简洁和高对比度的图像时非常有效。本文将深入介绍图像二值化的概念、原理、常见算法及应用场景。

1. 什么是图像二值化？

图像二值化是指将彩色或灰度图像转换为二值图像（也称为黑白图像）的过程。二值图像只有两种像素值，一般是0和255，分别代表黑色和白色。

二值化的目标：

通过将图像中的像素值转化为两个极端值（通常是0和255），使得图像的特征更加突出，便于进一步的图像处理，比如轮廓提取、对象检测等。

常见应用：

字符识别：如OCR（光学字符识别）技术。
目标检测：在图像中分割出目标。
图像分割：根据某些条件将图像划分为前景和背景。

2. 图像二值化的原理

图像的每一个像素都有一定的灰度值（灰度图像）。二值化的目的是根据某个阈值，将图像的像素值分为两类：

前景（目标）：图像中的感兴趣部分，通常为白色（255）。
背景：图像中不需要关注的部分，通常为黑色（0）。

在具体实现时，图像的每个像素值与预设的阈值进行比较：

如果像素值大于阈值，则该像素为白色（255）。
如果像素值小于或等于阈值，则该像素为黑色（0）。

这种方法的关键在于如何选择阈值。阈值的选择将直接影响二值化效果的好坏。

3. 二值化算法

3.1 全局阈值法

最简单的一种二值化方法。选择一个固定的阈值，遍历每一个像素，将其灰度值与该阈值进行比较，大于阈值的像素值变为255，其他变为0。

实现步骤：

读取灰度图像。
选择一个阈值。
对图像中的每个像素进行比较，应用二值化规则。

python 复制代码

import cv2

# 读取图像
image = cv2.imread('example.jpg', 0)

# 设置阈值
threshold_value = 127

# 应用全局阈值
_, binary_image = cv2.threshold(image, threshold_value, 255, cv2.THRESH_BINARY)

# 显示结果
cv2.imshow("Binary Image", binary_image)
cv2.waitKey(0)
cv2.destroyAllWindows()

参数说明

src ：输入图像（可以是灰度图像，也可以是单通道图像）。输入图像的类型应为 CV_8U（8-bit unsigned integer），即图像的像素值范围是 [0, 255]。
thresh ：阈值（标量）。将输入图像中的像素值与此阈值进行比较，以决定哪些像素应该设置为 0，哪些像素应该设置为 maxval（通常为 255）。
maxval ：最大值。小于阈值的像素将被设置为 0（或其他自定义值），大于阈值的像素将被设置为 maxval（通常为 255）。
type：阈值类型，决定如何对像素值进行处理。常见的阈值类型有：
- cv2.THRESH_BINARY：如果像素值大于阈值，设置为 maxval，否则设置为 0（黑色）。
- cv2.THRESH_BINARY_INV：如果像素值大于阈值，设置为 0，否则设置为 maxval（白色反转）。
- cv2.THRESH_TRUNC：如果像素值大于阈值，将其截断为阈值（即设为 thresh），否则保持原值。
- cv2.THRESH_TOZERO：如果像素值大于阈值，保持原值，否则设置为 0。
- cv2.THRESH_TOZERO_INV：如果像素值大于阈值，设置为 0，否则保持原值。
retval ：返回值，通常是所用的阈值。如果是 THRESH_OTSU 或 THRESH_TRIANGLE，返回值为计算出的阈值。
dst：输出图像，二值化后的图像。

常见的阈值类型

cv2.THRESH_BINARY ：传统的二值化，如果像素值大于阈值 thresh，则将其设为 maxval，否则设为 0（黑色）。
cv2.THRESH_BINARY_INV ：反转的二值化。如果像素值大于阈值 thresh，则将其设为 0（黑色），否则设为 maxval（白色）。
cv2.THRESH_TRUNC ：阈值截断。如果像素值大于 thresh，则将其值截断为 thresh，否则保持不变。
cv2.THRESH_TOZERO ：如果像素值大于 thresh，则保持原值，否则设为 0。
cv2.THRESH_TOZERO_INV ：反转的 TOZERO。如果像素值大于 thresh，则设为 0，否则保持原值。

优缺点：

优点：实现简单，计算量小。
缺点：阈值选取困难，尤其是图像背景与前景对比不明显时，效果不佳。

3.2 自适应阈值法

自适应阈值法是针对全局阈值法的一种改进，它根据图像局部区域的特征动态计算每个像素的阈值，适用于不同光照条件下的图像。自适应阈值法可以有效解决光照不均匀问题。

实现步骤：

将图像划分为多个小区域（通常是窗口）。
对每个小区域计算局部的阈值。
使用局部阈值进行二值化。

python 复制代码

import cv2

# 读取图像
image = cv2.imread('example.jpg', 0)

# 自适应阈值
binary_image = cv2.adaptiveThreshold(image, 255, cv2.ADAPTIVE_THRESH_MEAN_C,
                                     cv2.THRESH_BINARY, 11, 2)

# 显示结果
cv2.imshow("Binary Image", binary_image)
cv2.waitKey(0)
cv2.destroyAllWindows()

参数说明

src ：输入图像（必须是灰度图像，即单通道图像）。输入图像的类型可以是 CV_8U（8-bit unsigned integer），通常是灰度图像。
maxValue ：最大值，即二值化后的最大像素值。通常设为 255，代表最大亮度。
adaptiveMethod：自适应阈值计算方法，有两种可选的计算方式：
- cv2.ADAPTIVE_THRESH_MEAN_C：基于邻域区域的平均值来计算阈值。
- cv2.ADAPTIVE_THRESH_GAUSSIAN_C：基于邻域区域的加权和（高斯加权）来计算阈值。
thresholdType：阈值类型，指定如何应用计算出的阈值：
- cv2.THRESH_BINARY：大于阈值的像素设为 maxValue，否则设为 0（黑色）。
- cv2.THRESH_BINARY_INV：与 cv2.THRESH_BINARY 相反，小于阈值的像素设为 maxValue，否则设为 0。
blockSize ：邻域区域的大小（奇数）。它决定了用于计算每个像素阈值的区域大小。例如，blockSize=11 意味着每个像素的阈值是以一个 11x11 的邻域窗口计算的。必须是奇数（如 3, 5, 7, 9, 11 等）。
C ：常数项，用于调整阈值。计算出的局部阈值会减去常数 C，它的作用是调节二值化的灵敏度。这个参数可以使阈值更高或更低，通常设置为一个小的整数（如 5 或 10）。

优缺点：

优点：适应性强，能处理光照不均匀的图像。
缺点：计算量较大，处理速度较慢。

3.3 Otsu's 阈值法

Otsu's 阈值法是一种基于图像灰度分布的自动阈值选择方法，它通过最大化类间方差来选择最佳的阈值。该方法不需要人工设定阈值，适合于图像中前景和背景对比强烈的情况。

实现步骤：

计算图像的直方图。
通过 Otsu 方法选择一个最优阈值，使得前景和背景的类间方差最大。
使用该阈值进行二值化。

python 复制代码

import cv2

# 读取图像
image = cv2.imread('example.jpg', 0)

# 使用Otsu的阈值方法
_, binary_image = cv2.threshold(image, 0, 255, cv2.THRESH_BINARY + cv2.THRESH_OTSU)

# 显示结果
cv2.imshow("Binary Image", binary_image)
cv2.waitKey(0)
cv2.destroyAllWindows()

优缺点：

优点：无需人工设定阈值，自动化程度高，适用于对比度强的图像。
缺点：当图像背景与前景不明显区分时，效果不理想。

4. 图像二值化的应用场景

4.1 光学字符识别（OCR）

OCR 技术用于从扫描的文档或图像中提取文字。二值化在 OCR 中起到了关键作用，通过将图像转换为黑白色，减少了干扰信息，增强了字符的对比度，进而提高了识别精度。

4.2 目标检测与分割

二值化常用于将目标与背景分离。在目标检测任务中，二值化有助于简化图像，快速提取出目标区域。

4.3 医学图像处理

在医学图像中，二值化常用于分割图像中的病变区域。例如，使用二值化处理 CT 或 MRI 图像，以提取肿瘤或其他异常组织的区域。

4.4 边缘检测

通过二值化后的图像，可以更加清晰地显示出图像的边缘，进而用于后续的边缘检测或轮廓提取等操作。

5. 总结

图像二值化是图像处理中非常基础且重要的操作。它将图像中的信息压缩为仅含两种颜色的图像，在许多领域中都有广泛应用。通过简单的阈值选择或更先进的自适应和 Otsu 方法，图像的前景和背景可以被清晰地分离出来，从而为后续的图像分析和处理提供便利。

全局阈值法：简单高效，但在复杂图像中可能效果不好。
自适应阈值法：适应性强，处理光照不均匀的图像效果好。
Otsu's 方法：自动选择最优阈值，适用于前景与背景对比明显的图像。

随着技术的不断发展，二值化技术在人工智能、医学影像、图像识别等领域的应用将越来越广泛。如果你也在处理图像时遇到二值化的需求，选择合适的算法将极大地提升你的工作效率和精度。