Opencv 学习笔记:文字图像预处理(二值化 + 闭运算优化)

文字图像识别前的预处理是提升识别率的关键,本文以文字图像为例,演示 "灰度化→二值化→闭运算" 的标准化预处理流程,解决文字笔画断裂、孔洞问题,新手可直接复用。

核心代码实现

python 复制代码
import cv2 as cv
import numpy as np

# 1. 读取图像并校验
src = cv.imread(".\image\8.bmp")
if src is None:
    print('could not load image')
    exit()

# 2. 自适应窗口显示原图(适配不同屏幕)
cv.namedWindow('src', cv.WINDOW_NORMAL)
cv.resizeWindow('src', 700, 400)
cv.imshow("src", src)

# 3. 预处理核心流程
gray = cv.cvtColor(src, cv.COLOR_BGR2GRAY)  # 转灰度图
ret, binary = cv.threshold(gray, 120, 255, cv.THRESH_BINARY)  # 二值化
kernel = cv.getStructuringElement(cv.MORPH_RECT, (3, 3))  # 3×3矩形核
closed1 = cv.morphologyEx(binary, cv.MORPH_CLOSE, kernel)  # 闭运算填补笔画孔洞

# 4. 显示处理后图像
cv.namedWindow('outimage', cv.WINDOW_NORMAL)
cv.resizeWindow('outimage', 700, 400)
cv.imshow('outimage', closed1)

cv.waitKey(0)
cv.destroyAllWindows()

关键知识点解析

1. 文字图像预处理逻辑

步骤 核心作用 调优要点
灰度化 去除颜色干扰,简化后续计算 必选步骤,无参数可调
二值化 将文字(前景)与背景分离,转为黑白图像 阈值 120 可根据文字明暗调整
闭运算 填补文字笔画中的小孔洞、连接断裂笔画 3×3 核适配常规文字,避免过度膨胀

2. 实用细节说明

  • 窗口自适应cv.WINDOW_NORMAL + resizeWindow 解决高分辨率文字图像显示不全问题,固定 700×400 适配大部分屏幕;
  • 核大小选择:文字预处理优先用 3×3 小核,过大的核会导致文字笔画粘连,影响后续识别;
  • 阈值调整:若文字偏暗,可降低二值化阈值(如 100);若背景噪点多,可提高阈值(如 140)。

3. 扩展优化方向

  • 若文字有白色噪点:在闭运算前增加开运算(cv.MORPH_OPEN)消除噪点;
  • 若光照不均:替换固定阈值二值化为自适应二值化(cv.adaptiveThreshold);
  • 批量处理:封装为函数,遍历文件夹实现多文字图像自动预处理。

总结

  1. 文字图像预处理核心是 "灰度→二值化→闭运算",闭运算可有效修复文字笔画断裂问题;
  2. 3×3 小核是文字处理的最优选择,避免核过大导致笔画粘连;
  3. 窗口自适应显示是提升实操体验的小技巧,适配不同分辨率图像。
相关推荐
XGeFei16 小时前
【Fastapi学习笔记(3)】——资源的层级关系、安全性-幂等性、Field、工厂函数
笔记·学习·fastapi
星恒随风17 小时前
Python 基础语法详解(一):从表达式、变量到数据类型
开发语言·笔记·python·学习
暴躁小师兄数据学院19 小时前
【AI大数据工程师特训笔记】第14讲:Linux操作系统与shell脚本
大数据·人工智能·笔记
tedcloud12319 小时前
cc-switch评测:多AI Coding Agent管理工具详解
数据库·人工智能·sql·学习·自动化
土狗TuGou19 小时前
SQL内功笔记 · 第8篇:事务的四大特性与隔离级别
数据库·笔记·后端·sql·mysql·oracle
胡图图不糊涂^_^20 小时前
测试BUG篇
学习·bug·测试
智者知已应修善业20 小时前
【51单片机用T0定时器方式1,实现0.5S的时间间隔实现第一次一个灯亮、第二次二个灯亮,直到全部灯亮,然后重复整个过程】2023-12-29
c++·经验分享·笔记·算法·51单片机
智者知已应修善业20 小时前
【51单片机4位静态数码管显示1234】2023-11-14
c++·经验分享·笔记·算法·51单片机
whyTeaFo21 小时前
MIT6.1810: xv6 book Chapter4: Traps and system calls 笔记
笔记
jimbo_lee21 小时前
yocto 用法(随手笔记,记录以备不时之需)
笔记·yocto