基于pytesseract的OCR图片识别

简介

pytesseract是基于谷歌的tesseract的OCR包,支持识别一些简单的数字、字母、中文。

安装

安装引擎

下载地址:https://digi.bib.uni-mannheim.de/tesseract/

一般是Windows 64位系统最新版:

如果要识别中文,注意选中中文模块。

把tesseract.exe目录加入Path,如D:\Program Files\Tesseract-OCR

安装pytesseract包

bash 复制代码
pip install Pillow
pip install pytesseract

测试代码

python 复制代码
from PIL import Image
import pytesseract

res = pytesseract.image_to_string(Image.open('test.jpg'), lang='chi_sim')
print(res)

相关链接

https://github.com/tesseract-ocr/tesseract

相关推荐
没了对象省了流量ii2 小时前
本地高精度OCR!由GPT-4o-mini驱动的开源OCR!
ocr
paixiaoxin9 小时前
CV-OCR经典论文解读|An Empirical Study of Scaling Law for OCR/OCR 缩放定律的实证研究
人工智能·深度学习·机器学习·生成对抗网络·计算机视觉·ocr·.net
机器视觉知识推荐、就业指导3 天前
深度学习OCR与传统OCR对比实验:图像数据集联系博主获取
人工智能·深度学习·ocr
翔云API4 天前
驾驶证识别API-JavaScript驾驶证ocr接口集成-场景解析
ocr
AIBigModel4 天前
OCR多模态大模型:视觉模型与LLM的结合之路
ocr
坐井观老天4 天前
如何在OpenCV中运行自定义OCR模型
opencv·计算机视觉·ocr
中安OCR人工智能5 天前
车牌识别OCR授权:助力国产化升级,全面提升道路监控效率
人工智能·算法·ocr
J不A秃V头A5 天前
OCR:文字识别
java·ocr
cv2016_DL5 天前
ocr中CTC解码相关
算法·ocr·transformer
蔡不菜和他的uU们7 天前
OCR实践—PaddleOCR
ocr