基于pytesseract的OCR图片识别

简介

pytesseract是基于谷歌的tesseract的OCR包,支持识别一些简单的数字、字母、中文。

安装

安装引擎

下载地址:https://digi.bib.uni-mannheim.de/tesseract/

一般是Windows 64位系统最新版:

如果要识别中文,注意选中中文模块。

把tesseract.exe目录加入Path,如D:\Program Files\Tesseract-OCR

安装pytesseract包

bash 复制代码
pip install Pillow
pip install pytesseract

测试代码

python 复制代码
from PIL import Image
import pytesseract

res = pytesseract.image_to_string(Image.open('test.jpg'), lang='chi_sim')
print(res)

相关链接

https://github.com/tesseract-ocr/tesseract

相关推荐
Kai HVZ15 小时前
《PaddleOCR》—— 多相机协同工业字符检测与异常报警系统
数码相机·计算机视觉·ocr
萧鼎3 天前
深入解析 Umi-OCR:高效的免费开源 OCR 文字识别工具
python·ocr·umi-ocr
金智维科技官方6 天前
如何结合NLP(自然语言处理)技术提升OCR系统的语义理解和上下文感知能力?
人工智能·自然语言处理·ocr
Hello server6 天前
OLMo OCR:让文字从图片里“跳”出来的魔法工具
ocr
闰土小蒋8 天前
thinkphp5对接阿里云ocr试卷切题
阿里云·云计算·ocr
缘来的精彩8 天前
Android OCR技术实现与优化指南
android·ocr·androidndk
妄想出头的工业炼药师10 天前
开源ocr
ocr
资源大全免费分享10 天前
全新开源 OCR 模型:精准识别复杂内容,迈向 2.0 时代!
ocr
少年码客14 天前
C#中开发OCR应用时,以下是一些推荐的开源库和工具
开发语言·c#·ocr
山居秋暝LS15 天前
图像处理案例06 OCR应用
opencv·计算机视觉·ocr