python pytesseract库,ocr

pytesseract

  • 安装pytesseract-ocr

    mac:

    python 复制代码
    //先安装依赖库libpng, jpeg, libtiff, leptonica
    brew install leptonica
    
    //安装tesseract的同时安装训练工具
    brew install --with-training-tools tesseract
    
    //安装tesseract的同时安装所有语言,语言包比较大,如果安装的话时间较长,建议不安装,按需选择
    brew install  --all-languages tesseract
    
    //安装tesseract,并安装训练工具和语言
    brew install --all-languages --with-training-tools tesseract 
    
    //只安装tesseract,不安装训练工具
    brew install  tesseract

    win:

    安装包地址:https://github.com/UB-Mannheim/tesseract/wiki

    配置环境变量

    安装依赖包:

    pip install pytesseract

    pip install pillow

  • 下载语言库

    chi_sim.traineddata:中文简体

    eng.traineddata:英文

    https://github.com/tesseract-ocr/tessdata

  • 使用

    python 复制代码
    from PIL import Image
    import pytesseract
    text = pytesseract.image_to_string(Image.open('./eng.png')
                                       ,lang='eng' # 指定语言,chi_sim为简体中文
                                      )
    print(text)

相关推荐
2401_861412141 小时前
Python编程从入门到实践 PDF 高清版
python·pdf
2301_778658801 小时前
【Python训练营打卡】day31 @浙大疏锦行
python
敲键盘的小夜猫2 小时前
如何理解大模型的幻觉输出及RAG技术的应用与实战案例
开发语言·python
三道杠卷胡2 小时前
【AI News | 20250520】每日AI进展
人工智能·pytorch·python·语言模型·github
Takoony2 小时前
verify_ssl 与 Token 验证的区别详解
python
Mr_Dwj2 小时前
【蓝桥杯真题精讲】第 16 届 Python A 组(省赛)
python·蓝桥杯
接着奏乐接着舞2 小时前
spring boot 注解 @bean
spring boot·后端·python
我教你啊3 小时前
Python网络爬虫入门指南
python
量态猫3 小时前
pycharm无需科学上网工具下载插件的解决方案
ide·python·pycharm
钢铁男儿3 小时前
PyQt5绘图全攻略:QPainter、QPen、QBrush与QPixmap详解
python·qt·信息可视化