【OCR】 - Tesseract OCR在mac系统中安装

Tesseract OCR

在Mac环境下安装Tesseract OCR(Optical Character Recognition)通常可以通过Homebrew包管理器进行。以下是安装步骤:

安装Homebrew

如果你还没有安装Homebrew,请访问 https://brew.sh/ 并按照页面上的说明安装。

使用Homebrew安装Tesseract

  1. 打开终端(Terminal)应用程序。
  2. 在终端中输入以下命令以安装Tesseract:
bash 复制代码
brew install tesseract

这将下载并安装最新版本的Tesseract,同时可能还会安装一些依赖项。

安装语言包

要在Mac上下载Tesseract的简体中文语言数据包(chi_sim.traineddata),你可以按照以下步骤进行操作:

下载语言数据包

  1. 访问Tesseract官方镜像站点之一:https://github.com/tesseract-ocr/tessdata_fasthttps://github.com/tesseract-ocr/tessdata_best
  2. 在GitHub页面上,找到并点击"Clone or download"按钮,然后选择"Download ZIP"来下载整个项目。
  3. 解压缩下载的ZIP文件,你会看到一个名为 tessdata

安装语言数据包

  • 1.找到Tesseract在Mac上的安装位置。通常情况下,如果你使用Homebrew安装,它可能位于
    /usr/local/Cellar/tesseract/版本号/share/tessdata
  • 2.将解压后的
    tessdata
    chi_sim.traineddata
    tessdata

验证安装

1.打开终端(Terminal)应用程序。

2.输入以下命令以验证是否已经正确安装了Tesseract和简体中文语言数据包:

bash 复制代码
tesseract --version

这将显示你当前安装的Tesseract版本信息。

3.检查可用的语言列表:

bash 复制代码
tesseract --list-langs

如果一切正常,你应该能在输出列表中看到chi_sim。

现在,你就可以使用Tesseract识别简体中文图像了。

相关推荐
许彰午几秒前
06_Java面向对象入门
java·开发语言·python
ZHW_AI课题组几秒前
使用 Rectified Flow 和 Diffusion Transformer实现 MNIST 手写数字图像生成
人工智能·python·机器学习
Royzst4 分钟前
一、IO 概述
开发语言·python
Omics Pro6 分钟前
P4医学4大支柱需绑定4大数字技术才可落地
人工智能·python·算法·机器学习·plotly
海鸥-w7 分钟前
前端学习python第三天笔记整理(list 列表,str字符串,tuple元组,set集合,dect,函数,类型注解)
前端·python·学习
机器学习是魔鬼13 分钟前
在矩池云上开箱即用Energy Forecasting:能源电力电价预测实战指南
人工智能·python·机器学习
想要成为糕糕手15 分钟前
从Python基础到LLM接口实战:在Notebook上实现AI自动生成亚马逊电商文案
python·openai
郝学胜-神的一滴18 分钟前
力扣 144:二叉树前序遍历的优雅实现
java·数据结构·c++·python·算法·leetcode·职场和发展
拾年27519 分钟前
NumPy数组创建完全指南:从零搭建你的数字积木城
python·机器学习·numpy
王小菲23 分钟前
你能在泰坦尼克号上活下来吗-利用python进行探索性数据分析
python