msys2 |arch pacman:tesseract ocr 安装 - 思源笔记自动调用

安装之后,思源笔记能自动调用,ocr识别图片中的文字,可被搜索到。

思源笔记 > 使用指南 > 资源文件 中有一些说明。

msys2安装的话:pacman -S ***tesseract***, 包括:软件本体&语言支持包

bash 复制代码
pacman -S mingw-w64-ucrt-x86_64-tesseract-ocr\
mingw-w64-ucrt-x86_64-tesseract-data-chi_sim \
mingw-w64-ucrt-x86_64-tesseract-data-chi_sim_vert \
mingw-w64-ucrt-x86_64-tesseract-data-chi_tra \
mingw-w64-ucrt-x86_64-tesseract-data-chi_tra_vert \
mingw-w64-ucrt-x86_64-tesseract-data-eng

设置环境变量:

  • PATH: tesseract.exe所在文件夹,比如C:\softwares\msys2\msys64\ucrt64\bin
  • TESSDATA_PREFIX:语言包所在文件夹,比如C:\softwares\msys2\ucrt64\share\tessdata

不设置这个可能导致ocr乱码

存在的问题:

  • 有时ocr不准
  • 有时不对某些图片执行ocr
相关推荐
千航@abc4 小时前
vim多文件操作如何同屏开多个文件
linux·编辑器·vim
Pakho love6 小时前
Linux:文件与fd(被打开的文件)
android·linux·c语言·c++
Tangcan-6 小时前
Linux中基础开发工具(yum,vim,gcc/g++,git,gdb/cgdb)
linux·git·vim
千航@abc7 小时前
vim交换文件的作用
linux·编辑器·vim
一只码代码的章鱼9 小时前
计算机网络 笔记 网络层 3
笔记·计算机网络
瑶光守护者9 小时前
【协议详解】卫星通信5G IoT NTN SIB32-NB 信令详解
笔记·物联网·学习·5g·架构·卫星通信·3gpp
流星白龙10 小时前
【Linux】使用管道实现一个简易版本的进程池
linux·运维·服务器
笑鸿的学习笔记10 小时前
qt-Quick3D笔记之官方例程Runtimeloader Example运行笔记
笔记·qt·3d
爱码小白10 小时前
InnoSetup使用教程笔记
笔记·python
自信不孤单11 小时前
Linux线程安全
linux·多线程·条件变量·线程安全·同步··互斥