基于pytesseract的OCR图片识别

小龙在山东2024-07-15 23:33

简介

pytesseract是基于谷歌的tesseract的OCR包，支持识别一些简单的数字、字母、中文。

安装

安装引擎

下载地址：https://digi.bib.uni-mannheim.de/tesseract/

一般是Windows 64位系统最新版：

如果要识别中文，注意选中中文模块。

把tesseract.exe目录加入Path，如D:\Program Files\Tesseract-OCR。

安装pytesseract包

bash 复制代码

pip install Pillow
pip install pytesseract

测试代码

python 复制代码

from PIL import Image
import pytesseract

res = pytesseract.image_to_string(Image.open('test.jpg'), lang='chi_sim')
print(res)

相关链接

https://github.com/tesseract-ocr/tesseract

上一篇：深入了解WebKit：简介及工作流程详解

下一篇：react-类组件2

热门推荐

012026年7月AI圈大地震：GPT-5.6被政府限制、Claude入驻Slack、Anthropic自研芯片 02GitHub 镜像站点 03如何新建文件夹？电脑新建文件夹的4种方法 04AI科技热点日报 | 2026年07月01日 05幻兽帕鲁 - 服务器管理员权限与 GM 命令完全指南 06国内可直接用、免费额度/永久免费的大模型API清单（含 SiliconFlow、火山、阿里、智谱、百度、Kimi、DeepSeek、DMXAPI 等）07AI 编程 IDE 全景解析 2026：Agent 全面接管开发链路 082026 国产 AI 大模型横评：DeepSeek、通义千问、Kimi、文心一言、星火、豆包谁更能打？092026 年 AI 大模型 & AI 编程工具实战全总结 102026年AI技术突破与产业落地全景：从GPT-5到多模态智能体的新纪元