msys2 |arch pacman:tesseract ocr 安装 - 思源笔记自动调用

安装之后,思源笔记能自动调用,ocr识别图片中的文字,可被搜索到。

思源笔记 > 使用指南 > 资源文件 中有一些说明。

msys2安装的话:pacman -S ***tesseract***, 包括:软件本体&语言支持包

bash 复制代码
pacman -S mingw-w64-ucrt-x86_64-tesseract-ocr\
mingw-w64-ucrt-x86_64-tesseract-data-chi_sim \
mingw-w64-ucrt-x86_64-tesseract-data-chi_sim_vert \
mingw-w64-ucrt-x86_64-tesseract-data-chi_tra \
mingw-w64-ucrt-x86_64-tesseract-data-chi_tra_vert \
mingw-w64-ucrt-x86_64-tesseract-data-eng

设置环境变量:

  • PATH: tesseract.exe所在文件夹,比如C:\softwares\msys2\msys64\ucrt64\bin
  • TESSDATA_PREFIX:语言包所在文件夹,比如C:\softwares\msys2\ucrt64\share\tessdata

不设置这个可能导致ocr乱码

存在的问题:

  • 有时ocr不准
  • 有时不对某些图片执行ocr
相关推荐
现在,此刻4 小时前
李沐深度学习笔记D3-线性回归
笔记·深度学习·线性回归
SongYuLong的博客5 小时前
Linux开源代码汇总
linux·运维·服务器
JiMoKuangXiangQu5 小时前
Linux 内存管理 (5):buddy 内存分配简要流程
linux·内存管理·buddy 分配器
铭哥的编程日记5 小时前
【Linux网络】应用层协议HTTP
linux·运维·http
d111111111d5 小时前
STM32外设学习--DMA直接存储器读取(AD扫描程序,DMA搬运)--学习笔记。
笔记·stm32·单片机·嵌入式硬件·学习
yolo_guo5 小时前
opencv 学习: 07 使用迭代器 (iterator) 遍历像素
linux·c++·opencv
子牙老师5 小时前
硬盘第一关:MBR VS GPT
linux·操作系统·文件系统
labview_自动化5 小时前
GitHub笔记
笔记·github
华法林的小助手6 小时前
[笔记]SolidWorks转URDF 在rviz2中显示
笔记
郝学胜-神的一滴6 小时前
Qt QPushButton 样式完全指南:从基础到高级实现
linux·开发语言·c++·qt·程序人生