msys2 |arch pacman:tesseract ocr 安装 - 思源笔记自动调用

安装之后,思源笔记能自动调用,ocr识别图片中的文字,可被搜索到。

思源笔记 > 使用指南 > 资源文件 中有一些说明。

msys2安装的话:pacman -S ***tesseract***, 包括:软件本体&语言支持包

bash 复制代码
pacman -S mingw-w64-ucrt-x86_64-tesseract-ocr\
mingw-w64-ucrt-x86_64-tesseract-data-chi_sim \
mingw-w64-ucrt-x86_64-tesseract-data-chi_sim_vert \
mingw-w64-ucrt-x86_64-tesseract-data-chi_tra \
mingw-w64-ucrt-x86_64-tesseract-data-chi_tra_vert \
mingw-w64-ucrt-x86_64-tesseract-data-eng

设置环境变量:

  • PATH: tesseract.exe所在文件夹,比如C:\softwares\msys2\msys64\ucrt64\bin
  • TESSDATA_PREFIX:语言包所在文件夹,比如C:\softwares\msys2\ucrt64\share\tessdata

不设置这个可能导致ocr乱码

存在的问题:

  • 有时ocr不准
  • 有时不对某些图片执行ocr
相关推荐
你要飞9 小时前
考研线代第四课:线性方程组
笔记·线性代数·考研·矩阵
week_泽9 小时前
第5课:短期记忆与长期记忆原理 - 学习笔记_5
java·笔记·学习·ai agent
oMcLin10 小时前
如何在 Ubuntu 22.04 LTS 上部署并优化 Magento 电商平台,提升高并发请求的响应速度与稳定性?
linux·运维·ubuntu
日更嵌入式的打工仔10 小时前
嵌入式系统设计师软考个人笔记<1>
笔记
Qinti_mm10 小时前
Linux io_uring:高性能异步I/O革命
linux·i/o·io_uring
优雅的38度10 小时前
linux环境下,使用docker安装apache kafka (docker-compose)
linux·架构
想唱rap11 小时前
表的约束条件
linux·数据库·mysql·ubuntu·bash
山上三树11 小时前
对比用户态线程与内核态轻量级进程
linux
2501_9481953411 小时前
RN for OpenHarmony英雄联盟助手App实战:设置实现
linux·ubuntu
阿甘正赚.11 小时前
Linux初学
linux·运维·服务器