python pytesseract库,ocr

pytesseract

  • 安装pytesseract-ocr

    mac:

    python 复制代码
    //先安装依赖库libpng, jpeg, libtiff, leptonica
    brew install leptonica
    
    //安装tesseract的同时安装训练工具
    brew install --with-training-tools tesseract
    
    //安装tesseract的同时安装所有语言,语言包比较大,如果安装的话时间较长,建议不安装,按需选择
    brew install  --all-languages tesseract
    
    //安装tesseract,并安装训练工具和语言
    brew install --all-languages --with-training-tools tesseract 
    
    //只安装tesseract,不安装训练工具
    brew install  tesseract

    win:

    安装包地址:https://github.com/UB-Mannheim/tesseract/wiki

    配置环境变量

    安装依赖包:

    pip install pytesseract

    pip install pillow

  • 下载语言库

    chi_sim.traineddata:中文简体

    eng.traineddata:英文

    https://github.com/tesseract-ocr/tessdata

  • 使用

    python 复制代码
    from PIL import Image
    import pytesseract
    text = pytesseract.image_to_string(Image.open('./eng.png')
                                       ,lang='eng' # 指定语言,chi_sim为简体中文
                                      )
    print(text)

相关推荐
listhi52010 分钟前
Python实现信号小波分解与重构
开发语言·python·重构
站大爷IP32 分钟前
Python从零到一:手把手带你写出第一个实用程序
python
nightunderblackcat35 分钟前
进阶向:Python开发简易QQ聊天机器人
python·自动化
骑驴看星星a1 小时前
层次分析法代码笔记
开发语言·笔记·python·numpy
ghostwritten1 小时前
在 macOS 上 安装最新 Python 和 pip
python·macos·pip
Isaacingrid2 小时前
解决pytorch-lightning1.6.0安装时自动下载最新的pytorch方法
人工智能·pytorch·python
树叶会结冰2 小时前
python中的推导式
python
悟纤2 小时前
Suno API V5模型 python源码 —— 使用灵感模式进行出创作
开发语言·python·suno·ai音乐
xt19892882 小时前
测试开发:Python+Django实现接口测试工具
python·测试开发·django·自动化平台
Shun_Tianyou3 小时前
Python Day21 re模块正则表达式 简单小说爬取 及例题分析
开发语言·数据结构·python·算法·正则表达式