OTSU算法(大津算法)

Otsu 算法(大津算法)是一种经典的图像二值化方法,其核心是通过最大化类间方差自动确定全局阈值。以下是其具体工作原理和步骤:

1. 基本思想

假设图像由前景(目标)和背景两部分组成,且两者的灰度分布存在明显差异(直方图呈现双峰)。Otsu 算法通过寻找一个阈值,使得前景与背景之间的类间方差最大,从而将图像分割为二值图。

2. 数学推导

(1)计算灰度直方图
  • 统计图像中每个灰度值的像素个数,得到直方图 h[i]i为灰度级,范围 0~L-1)。
  • 总像素数 N = sum(h[i])
(2)遍历所有可能的阈值

假设阈值为 t,将图像分为两类:

  • 背景类 C0 :灰度值 < t
  • 前景类 C1 :灰度值 ≥ t
(3)计算类概率和均值
  • 背景类概率w0 = sum(h[0..t]) / N
  • 前景类概率w1 = sum(h[t+1..L-1]) / N = 1 - w0
  • 背景类均值μ0 = sum(i*h[i] for i=0..t) / (w0*N)
  • 前景类均值μ1 = sum(i*h[i] for i=t+1..L-1) / (w1*N)
(4)计算类间方差

总均值 μ = w0*μ0 + w1*μ1

类间方差 σ_b² = w0*(μ0 - μ)² + w1*(μ1 - μ)²

(5)寻找最优阈值

遍历所有可能的阈值 t,找到使 σ_b² 最大的 t,即为 Otsu 阈值。

3. 算法步骤

  1. 计算灰度直方图
  2. 遍历所有可能的阈值(通常从 1 到 L-2,避免极端值)。
  3. 计算每个阈值对应的类间方差
  4. 选择最大类间方差对应的阈值作为二值化阈值。

4. 关键特性

  • 自动性:无需手动设置阈值,适用于双峰直方图图像。
  • 鲁棒性:对光照变化和噪声有一定容忍度。
  • 局限性
    • 仅适用于双峰直方图图像,单峰或多峰场景效果差。
    • 全局阈值,无法处理光照不均匀的图像(需结合自适应阈值)。

5. 示例代码(OpenCV 实现)

python 复制代码
import cv2
import numpy as np

# 读取灰度图
img = cv2.imread('image.jpg', cv2.IMREAD_GRAYSCALE)

# Otsu阈值法
_, otsu_mask = cv2.threshold(img, 0, 255, cv2.THRESH_BINARY + cv2.THRESH_OTSU)

# 显示结果
cv2.imshow('Original', img)
cv2.imshow('Otsu Binary', otsu_mask)
cv2.waitKey(0)
cv2.destroyAllWindows()

6. 应用场景

  • 文档扫描(如身份证、票据)。
  • 简单物体分割(如硬币、印章)。
  • 图像预处理(如 OCR 前的二值化)。

7. 改进与扩展

  • 自适应 Otsu:分块计算局部 Otsu 阈值,处理非均匀光照。
  • 结合预处理:先通过高斯模糊降噪,再应用 Otsu。
  • 多阈值 Otsu:扩展到多类分割(需计算多峰直方图的类间方差)。

总结

Otsu 算法通过最大化类间方差自动确定全局阈值,是图像二值化的经典方法。其核心优势在于无需人工干预,但需图像直方图呈现双峰特性。实际应用中需结合预处理或其他方法以应对复杂场景。

相关推荐
东阳马生架构6 分钟前
Sentinel源码—8.限流算法和设计模式总结一
算法·sentinel
仙人掌_lz7 分钟前
A2A + MCP:构建实用人工智能系统的超强组合
人工智能
安科瑞蒋静7 分钟前
新能源汽车充电桩:多元化运营模式助力低碳出行
大数据·人工智能
猿小猴子16 分钟前
AI领域:MCP 与 A2A 协议的关系
人工智能
无妄无望17 分钟前
常见的神经网络权重文件格式及其详细说明
人工智能·深度学习·神经网络
蔗理苦28 分钟前
2025-04-18 李沐深度学习3 —— 线性代数
人工智能·深度学习·线性代数
玖玖passion1 小时前
排序专题
算法
kuan_li_lyg1 小时前
MATLAB - 小车倒立摆的非线性模型预测控制(NMPC)
开发语言·算法·matlab·机器人·mpc·模型预测控制·倒立摆
WenGyyyL1 小时前
读一篇AI论文并理解——通过幻觉诱导优化缓解大型视觉语言模型中的幻觉
人工智能·计算机视觉·语言模型·自然语言处理·视觉语言模型
微凉的衣柜1 小时前
VICP(Velocity-based ICP):通过运动校准实现精准姿态估计
人工智能·算法·计算机视觉