基于pytesseract的OCR图片识别

简介

pytesseract是基于谷歌的tesseract的OCR包,支持识别一些简单的数字、字母、中文。

安装

安装引擎

下载地址:https://digi.bib.uni-mannheim.de/tesseract/

一般是Windows 64位系统最新版:

如果要识别中文,注意选中中文模块。

把tesseract.exe目录加入Path,如D:\Program Files\Tesseract-OCR

安装pytesseract包

bash 复制代码
pip install Pillow
pip install pytesseract

测试代码

python 复制代码
from PIL import Image
import pytesseract

res = pytesseract.image_to_string(Image.open('test.jpg'), lang='chi_sim')
print(res)

相关链接

https://github.com/tesseract-ocr/tesseract

相关推荐
~烈1 天前
Umi-OCR图片批量识别工具教程
ocr·ocr识别工具·ocr识别软件
AI人工智能+2 天前
表格识别技术:通过深度学习方法,实现精准还原纸质表格的结构、内容与格式,并直接导出为可编辑的Excel文件
ocr·表格识别
沟通qq 19226382 天前
PCA-RF:主成分分析与随机森林的高效分类组合
ocr
2501_930799242 天前
数据安全新选择:访答本地知识库的隐私守护之道
人工智能·aigc·ocr
21992 天前
中文OCR产品与多模态大模型OCR能力选型报告
ocr
技术小甜甜2 天前
[Python] 使用 Tesseract 实现 OCR 文字识别全流程指南
开发语言·python·ocr·实用工具
wang6021252182 天前
OCR服务-本地打包docker+docker下载ssh调试
docker·ssh·ocr
小白狮ww2 天前
当 OCR 模型开始「理解整页文档」:HunyuanOCR 的端到端之路
人工智能·深度学习·机器学习·ocr·文字识别·文档处理·腾讯混元
2501_941982053 天前
结合 AI 视觉:使用 OCR 识别企业微信聊天记录中的图片信息
人工智能·ocr·企业微信
AI人工智能+3 天前
承兑汇票识别技术;融合OCR、深度学习和NLP的多模态智能系统,可实现秒级高精度识别
深度学习·ocr·承兑汇票识别