OpenCV 学习9-灰度转黑白二值图像

1、为什么需要图像二值化?

场景 说明
文字识别(OCR) 当需要提取图片(比如扫描的文件、发票图片、身份证)中的文字内容时,将图像二值化后,提高字符边缘清晰度,减少背景干扰,用于给OCR程序 识别
条形码 / 二维码识别 快速识别黑白条纹图案
医学图像处理 比如X光片中提取骨骼轮廓
目标检测与分割 定位图像中的特定区域,可用于质检环节检测缺陷区域

将复杂的灰度或彩色图像简化为只有黑白两种状态的图像(0 和 255)

图像二值化可达到 "化繁为简",在保留关键结构的同时去除冗余信息,在 OCR、目标分割、形态学处理等场景中非常有效。

当需要从图像中快速提取 有|没有在哪里 信息时,就可以尝试使用二值化处理。

2、图像二值化(Binarization)函数 cv2.threshold()

cv2.threshold() 是 OpenCV的图像二值化函数,将灰度图像转换为黑白二值图像。

通过设定一个阈值(threshold),将像素点分为两类:

  • >阈值为某一个值(如 255,白色)
  • ≤ 阈值为另一值(如 0,黑色)

2.1 函数定义

复制代码
retval, dst = cv2.threshold(src, thresh, maxval, type)
  • 返回值
    dst:新的二值图像
    retval: 实际使用的阈值
  • 参数说明
参数 类型 说明
src NumPy 数组 必须是灰度图像
thresh float 设定的阈值,比如128
maxval float 当像素满足条件时,设置的最大值(通常为 255)
type int 阈值类型
  • 阈值类型 type 说明
类型 名称 含义
cv2.THRESH_BINARY 二进制阈值化 if pixel > thresh: 255 else 0
cv2.THRESH_BINARY_INV 反向二进制 if pixel > thresh: 0 else 255
cv2.THRESH_TRUNC 截断 if pixel > thresh: thresh else pixel
cv2.THRESH_TOZERO 低于阈值清零 if pixel <= thresh: 0 else pixel
cv2.THRESH_TOZERO_INV 高于阈值清零 if pixel > thresh: 0 else pixel
cv2.THRESH_OTSU 自动计算最优阈值(基于 Otsu 算法) 需和上述类型 按位或组合使用, 如cv2.THRESH_BINARY + cv2.THRESH_OTSU

2.2 OTSU

OTSU(大津算法) 是一种经典的自动图像二值化方法,用于在灰度图像中自动选择最佳阈值,将图像分为前景和背景两部分。由日本学者 大津展之(Nobuyuki Otsu) 1979年提出。

算法解决的主要问题是:在不知道阈值的情况下,如何自动找出一个"最优"阈值来分割图像?

OTSU 算法的思路是:

最大化类间方差(Between-class Variance),让前景(目标)和背景之间的差异尽可能大,从而使分割最清晰。

2.3 代码示例

python 复制代码
import cv2
import numpy as np
import os

# 1.读取图像
img_path = "img/dog.jpg"
if not os.path.exists(img_path):
    raise FileNotFoundError(f"未找到图像文件{img_path}")

img = cv2.imread(img_path, cv2.IMREAD_GRAYSCALE)

thresh , img1 = cv2.threshold(img, 128, 255, cv2.THRESH_BINARY)

cv2.imshow("Original", img)
cv2.imshow("threshold", img1)
cv2.waitKey(0)
cv2.destroyAllWindows()
相关推荐
SunnyDays101111 小时前
如何使用 C# 转换 PowerPoint 为 HTML:完整指南
人工智能·opencv·计算机视觉·c#
_李小白1 天前
【android opencv学习笔记】Day 8: remap(像素位置重映射)
android·opencv·学习
xp_fangfei1 天前
通过 Marker(视觉标记)获取机器人位姿
opencv·机器人
Lhan.zzZ1 天前
笔记_2026.4.28_003
c++·笔记·qt·opencv
sali-tec1 天前
C# 基于OpenCv的视觉工作流-章56-OCR
图像处理·人工智能·opencv·算法·计算机视觉·ocr
_李小白2 天前
【android opencv学习笔记】Day 2: Mat类(图片数据结构体)
android·opencv·学习
Leon_Chenl2 天前
【已开源】【嵌入式 Linux 音视频+ AI 实战项目】瑞芯微 Rockchip 系列 RK3588-基于深度学习的人脸门禁+ IPC 智能安防监控系统
深度学习·opencv·yolo·ffmpeg·音视频·边缘计算·人脸识别+检测
H Journey2 天前
常用知识总结C++、CMake、Linux
linux·c++·opencv·cmake
sali-tec4 天前
C# 基于OpenCv的视觉工作流-章53-QR二维码1
图像处理·人工智能·opencv·算法·计算机视觉
星辰徐哥4 天前
OpenCV入门:Windows系统下OpenCV的安装与环境配置
人工智能·windows·opencv