msys2 |arch pacman:tesseract ocr 安装 - 思源笔记自动调用

安装之后,思源笔记能自动调用,ocr识别图片中的文字,可被搜索到。

思源笔记 > 使用指南 > 资源文件 中有一些说明。

msys2安装的话:pacman -S ***tesseract***, 包括:软件本体&语言支持包

bash 复制代码
pacman -S mingw-w64-ucrt-x86_64-tesseract-ocr\
mingw-w64-ucrt-x86_64-tesseract-data-chi_sim \
mingw-w64-ucrt-x86_64-tesseract-data-chi_sim_vert \
mingw-w64-ucrt-x86_64-tesseract-data-chi_tra \
mingw-w64-ucrt-x86_64-tesseract-data-chi_tra_vert \
mingw-w64-ucrt-x86_64-tesseract-data-eng

设置环境变量:

  • PATH: tesseract.exe所在文件夹,比如C:\softwares\msys2\msys64\ucrt64\bin
  • TESSDATA_PREFIX:语言包所在文件夹,比如C:\softwares\msys2\ucrt64\share\tessdata

不设置这个可能导致ocr乱码

存在的问题:

  • 有时ocr不准
  • 有时不对某些图片执行ocr
相关推荐
KingRumn16 小时前
Linux信号之标准信号与实时信号
linux·算法
QT 小鲜肉19 小时前
【Linux命令大全】001.文件管理之git命令(实操篇)
linux·服务器·笔记·git·elasticsearch
半夏知半秋19 小时前
docker常用指令整理
运维·笔记·后端·学习·docker·容器
sishen419919 小时前
嵌入式Linux没有学习方向怎么办,嵌入式Linux怎么学
linux
逆风水手19 小时前
Ansible自动化运维入门指南
linux·运维·自动化·ansible
LXS_35719 小时前
Day 18 C++提高 之 STL常用容器(string、vector、deque)
开发语言·c++·笔记·学习方法·改行学it
蒸蒸yyyyzwd19 小时前
网络编程——threadpool.h学习笔记
笔记·学习
浪子不回头41519 小时前
SGLang学习笔记
人工智能·笔记·学习
Cricyta Sevina21 小时前
Java IO 基础理论知识笔记
java·开发语言·笔记
旖旎夜光21 小时前
Linux(3)(下)
linux·学习