msys2 |arch pacman:tesseract ocr 安装 - 思源笔记自动调用

安装之后,思源笔记能自动调用,ocr识别图片中的文字,可被搜索到。

思源笔记 > 使用指南 > 资源文件 中有一些说明。

msys2安装的话:pacman -S ***tesseract***, 包括:软件本体&语言支持包

bash 复制代码
pacman -S mingw-w64-ucrt-x86_64-tesseract-ocr\
mingw-w64-ucrt-x86_64-tesseract-data-chi_sim \
mingw-w64-ucrt-x86_64-tesseract-data-chi_sim_vert \
mingw-w64-ucrt-x86_64-tesseract-data-chi_tra \
mingw-w64-ucrt-x86_64-tesseract-data-chi_tra_vert \
mingw-w64-ucrt-x86_64-tesseract-data-eng

设置环境变量:

  • PATH: tesseract.exe所在文件夹,比如C:\softwares\msys2\msys64\ucrt64\bin
  • TESSDATA_PREFIX:语言包所在文件夹,比如C:\softwares\msys2\ucrt64\share\tessdata

不设置这个可能导致ocr乱码

存在的问题:

  • 有时ocr不准
  • 有时不对某些图片执行ocr
相关推荐
客梦1 分钟前
数据结构-哈希表
java·数据结构·笔记
源梦想4 分钟前
飞车狂飙动作冒险网页小游戏Linux部署演示
linux·运维·服务器
YJlio6 分钟前
Autologon 学习笔记(9.7):安全自动登录的正确打开方式
笔记·学习·安全
四谎真好看8 分钟前
Java 黑马程序员学习笔记(进阶篇30)
java·笔记·学习·学习笔记
超级大只老咪8 分钟前
Nmap笔记
笔记
雍凉明月夜29 分钟前
视觉opencv学习笔记Ⅳ
笔记·opencv·学习·计算机视觉
断剑zou天涯32 分钟前
【算法笔记】KMP算法
java·笔记·算法
程序员东岸34 分钟前
《数据结构——排序(下)》分治与超越:快排、归并与计数排序的终极对决
数据结构·c++·经验分享·笔记·学习·算法·排序算法
ZRT000138 分钟前
Ubuntu 22.04安装ESP-IDF
linux·ubuntu·esp32·esp-idf
2301_795167201 小时前
Python 高手编程系列一十八:子类化内置类型
linux·windows·python