Tesseract OCR 安装

Tesseract OCR 的安装步骤因操作系统的不同而有所区别。以下是针对 Windows、macOS 和 Linux 系统的详细安装指导。

1. Windows

步骤:

  1. 下载 Tesseract 安装程序

  2. 安装 Tesseract

    • 双击下载的安装程序,按照提示完成安装。默认安装路径通常为 C:\Program Files\Tesseract-OCR
  3. 配置环境变量

    • 将 Tesseract 的安装路径添加到系统的 PATH 环境变量中,以便在命令行中可以直接调用 tesseract

      • 右键点击"此电脑" -> "属性" -> "高级系统设置" -> "环境变量"。
      • 在"系统变量"中找到 Path,选择后点击"编辑",然后添加 Tesseract 安装目录(如 C:\Program Files\Tesseract-OCR)。
  4. 下载语言包(可选)

    • 默认情况下,只包含英语语言包。如果需要其他语言,可以从 Tesseract Language Data 页面 下载所需的语言文件,并将其放置在 Tesseract-OCR\tessdata 目录下。

2. macOS

步骤:

  1. 使用 Homebrew 安装

    • 打开终端并输入以下命令以安装 Tesseract:
      brew install tesseract
  2. 安装语言包(可选)

    • 如果需要其他语言支持,可以使用以下命令来安装:
      brew install tesseract-lang

3. Linux (以 Ubuntu 为例)

步骤:

  1. 更新软件包列表

    sudo apt update

  2. 安装 Tesseract

    sudo apt install tesseract-ocr

  3. 安装额外的语言包(可选)

    • 例如,安装简体中文语言包:
      sudo apt install tesseract-ocr-chi-sim

验证安装

安装完成后,可以通过运行以下命令来验证 Tesseract 是否成功安装:

tesseract --version

如果能看到版本信息,则表示安装成功。

基本使用示例

提取图像中的文本,可以使用如下命令:

tesseract image.png output.txt

上面的命令会从 image.png 中提取文本并将结果保存至 output.txt 文件中。


希望这些步骤能够帮助你顺利安装 Tesseract OCR!如有任何问题,请随时询问。

相关推荐
AI人工智能+6 天前
CNN+CRNN+NER:如何实现食品经营许可证秒级结构化信息提取?
深度学习·ocr·食品经营许可证识别
摆烂小白敲代码6 天前
腾讯云智能结构化OCR在物流行业的应用
大数据·人工智能·经验分享·ocr·腾讯云
开开心心就好10 天前
免费音频转文字工具,绿色版离线多模型可用
人工智能·windows·计算机视觉·计算机外设·ocr·excel·语音识别
开开心心_Every11 天前
全屏程序切换工具,激活选中窗口快速切换
linux·运维·服务器·pdf·ocr·测试用例·模块测试
2401_8362358611 天前
名片识别产品:技术要点与应用场景深度解析
人工智能·科技·深度学习·ocr
njsgcs13 天前
glm-ocr ollama使用 python
ocr
开开心心就好13 天前
轻松鼠标连, 自定义区域模仿人手点击
人工智能·windows·物联网·计算机视觉·计算机外设·ocr·excel
littleshimmer13 天前
基于 C++ + Qt6 实现一款本地离线 OCR 工具(SnapOCR)
ocr
AI周红伟15 天前
周红伟:企业大模型微调和部署, DeepSeek-OCR v2技术原理和架构,部署案例实操。RAG+Agent智能体构建
大数据·人工智能·大模型·ocr·智能体·seedance
kongba00717 天前
如何在本地创建一个OCR工具,帮你识别文档,发票,合同等细碎的内容,并将结果给大模型整理格式输出。 经验工作流。给大模型生成代码就能直接跑。
大数据·ocr