【OCR】技术

OCR图像识别

此贴用来更新在工作中遇到的一些图片解析内容

一、OCR是什么

OCR(Optical Character Recognition,光学字符识别) 是​一种将图片中的文字自动识别并转换为可编辑文本的技术。比如:

  • 把一张手写笔记的照片 ➡️ 转成Word文档
  • 把扫描的PDF文件 ➡️ 转成可搜索的文本

二、Python中如何实现OCR

请见:基于Tesseract OCR的文本识别方法及代码示例

1.简单应用

python 复制代码
from PIL import Image
import pytesseract

# 设置Tesseract路径(根据你的安装位置修改)
pytesseract.pytesseract.tesseract_cmd = r'E:\developer_tools\Tesseract-OCR\tesseract.exe'

# 打开图片
image = Image.open("test.png")

# 识别文字
text = pytesseract.image_to_string(image, lang='chi_sim+eng')  # 中英文混合识别

# 打印结果
print(text)

三、OCR的核心步骤

1.​图像预处理​(提高识别准确率)

  • 灰度化:将彩色图转为黑白
  • 二值化:让文字更清晰
  • 去噪:去除背景干扰
python 复制代码
import cv2
image = cv2.imread("test.png")
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)  # 转为灰度
_, binary = cv2.threshold(gray, 150, 255, cv2.THRESH_BINARY)  # 二值化

2.​文字识别

python 复制代码
text = pytesseract.image_to_string(binary, lang='chi_sim')

3.​输出结果

  • 直接保存为文本文件
  • 生成可搜索的PDF(如你问题中的代码)

四、OCR到的应用场景

场景 说明
文档数字化 扫描件/照片转文本
车牌识别 停车场自动识别车牌
发票识别 自动提取发票金额、日期
手写笔记识别 将手写内容转为电子版

五、注意事项

1.图像质量决定效果 :模糊、倾斜、低对比度的图片识别率低。

2.多语言支持 :Tesseract支持100+种语言,需额外下载语言包。

3.复杂布局处理:表格、多列文本可能需要更复杂的处理。

六、扩展学习

  • 其他OCR库
    • easyocr:更适合中文场景
    • paddleocr:百度开发的OCR工具(中文效果优秀)
  • 深度学习OCR
    • 使用YOLO等模型实现更复杂的文本检测和识别。
相关推荐
一个人的博客@你15 小时前
C# 通用OCR识别
图像处理·c#·ocr·图像识别·文字提取
Grassto1 天前
dockerfile: PaddleOCR hubserving api 服务
docker·ocr·paddleocr
TextIn智能文档云平台2 天前
PDF文档解析新突破:图表识别、公式还原、手写字体处理,让AI真正读懂复杂文档!
图像处理·人工智能·算法·自然语言处理·pdf·ocr
带鱼工作室3 天前
通义读光系列文字检测+识别模型端到端OCR应用
python·opencv·计算机视觉·ocr
白熊1883 天前
【计算机视觉】OpenCV实战项目:Text-Extraction-Table-Image:基于OpenCV与OCR的表格图像文本提取系统深度解析
opencv·计算机视觉·ocr
沉到海底去吧Go3 天前
【身份证识别表格】批量识别身份证扫描件或照片保存为Excel表格,怎么大批量将身份证图片转为excel表格?基于WPF和腾讯OCR的识别方案
ocr·wpf·excel·身份证识别表格·批量扫描件身份证转表格·图片识别表格·图片识别excel表格
伊织code4 天前
MixTeX - 支持CPU推理的多模态LaTeX OCR
python·ai·ocr·latex·mixtex
十步杀一人_千里不留行6 天前
【实战教程】React Native项目集成Google ML Kit实现离线水表OCR识别
react native·react.js·ocr
小江-6 天前
基于计算机视觉的试卷答题区表格识别与提取技术
python·ocr
TextIn智能文档云平台7 天前
TextIn ParseX重磅功能更新:支持切换公式输出形式、表格解析优化、新增电子档PDF去印章
java·图像处理·人工智能·算法·自然语言处理·pdf·ocr