Otsu 算法(大津算法)是一种经典的图像二值化方法,其核心是通过最大化类间方差自动确定全局阈值。以下是其具体工作原理和步骤:
1. 基本思想
假设图像由前景(目标)和背景两部分组成,且两者的灰度分布存在明显差异(直方图呈现双峰)。Otsu 算法通过寻找一个阈值,使得前景与背景之间的类间方差最大,从而将图像分割为二值图。
2. 数学推导
(1)计算灰度直方图
- 统计图像中每个灰度值的像素个数,得到直方图
h[i]
(i
为灰度级,范围 0~L-1)。 - 总像素数
N = sum(h[i])
。
(2)遍历所有可能的阈值
假设阈值为 t
,将图像分为两类:
- 背景类 C0 :灰度值 <
t
- 前景类 C1 :灰度值 ≥
t
(3)计算类概率和均值
- 背景类概率 :
w0 = sum(h[0..t]) / N
- 前景类概率 :
w1 = sum(h[t+1..L-1]) / N = 1 - w0
- 背景类均值 :
μ0 = sum(i*h[i] for i=0..t) / (w0*N)
- 前景类均值 :
μ1 = sum(i*h[i] for i=t+1..L-1) / (w1*N)
(4)计算类间方差
总均值 μ = w0*μ0 + w1*μ1
类间方差 σ_b² = w0*(μ0 - μ)² + w1*(μ1 - μ)²
(5)寻找最优阈值
遍历所有可能的阈值 t
,找到使 σ_b²
最大的 t
,即为 Otsu 阈值。
3. 算法步骤
- 计算灰度直方图。
- 遍历所有可能的阈值(通常从 1 到 L-2,避免极端值)。
- 计算每个阈值对应的类间方差。
- 选择最大类间方差对应的阈值作为二值化阈值。
4. 关键特性
- 自动性:无需手动设置阈值,适用于双峰直方图图像。
- 鲁棒性:对光照变化和噪声有一定容忍度。
- 局限性 :
- 仅适用于双峰直方图图像,单峰或多峰场景效果差。
- 全局阈值,无法处理光照不均匀的图像(需结合自适应阈值)。
5. 示例代码(OpenCV 实现)
python
import cv2
import numpy as np
# 读取灰度图
img = cv2.imread('image.jpg', cv2.IMREAD_GRAYSCALE)
# Otsu阈值法
_, otsu_mask = cv2.threshold(img, 0, 255, cv2.THRESH_BINARY + cv2.THRESH_OTSU)
# 显示结果
cv2.imshow('Original', img)
cv2.imshow('Otsu Binary', otsu_mask)
cv2.waitKey(0)
cv2.destroyAllWindows()
6. 应用场景
- 文档扫描(如身份证、票据)。
- 简单物体分割(如硬币、印章)。
- 图像预处理(如 OCR 前的二值化)。
7. 改进与扩展
- 自适应 Otsu:分块计算局部 Otsu 阈值,处理非均匀光照。
- 结合预处理:先通过高斯模糊降噪,再应用 Otsu。
- 多阈值 Otsu:扩展到多类分割(需计算多峰直方图的类间方差)。
总结
Otsu 算法通过最大化类间方差自动确定全局阈值,是图像二值化的经典方法。其核心优势在于无需人工干预,但需图像直方图呈现双峰特性。实际应用中需结合预处理或其他方法以应对复杂场景。