msys2 |arch pacman:tesseract ocr 安装 - 思源笔记自动调用

安装之后,思源笔记能自动调用,ocr识别图片中的文字,可被搜索到。

思源笔记 > 使用指南 > 资源文件 中有一些说明。

msys2安装的话:pacman -S ***tesseract***, 包括:软件本体&语言支持包

bash 复制代码
pacman -S mingw-w64-ucrt-x86_64-tesseract-ocr\
mingw-w64-ucrt-x86_64-tesseract-data-chi_sim \
mingw-w64-ucrt-x86_64-tesseract-data-chi_sim_vert \
mingw-w64-ucrt-x86_64-tesseract-data-chi_tra \
mingw-w64-ucrt-x86_64-tesseract-data-chi_tra_vert \
mingw-w64-ucrt-x86_64-tesseract-data-eng

设置环境变量:

  • PATH: tesseract.exe所在文件夹,比如C:\softwares\msys2\msys64\ucrt64\bin
  • TESSDATA_PREFIX:语言包所在文件夹,比如C:\softwares\msys2\ucrt64\share\tessdata

不设置这个可能导致ocr乱码

存在的问题:

  • 有时ocr不准
  • 有时不对某些图片执行ocr
相关推荐
kebidaixu1 小时前
BCU 平台 RS485 驱动适配:从 THVD1406 到 ISO3082
linux
曲辕RPA2 小时前
曲辕RPA-鼠标悬停在文字上(OCR)
ocr·rpa
bing_feilong3 小时前
轻量级OCR
ocr
闪闪发亮的小星星3 小时前
开普勒三大定律
笔记
谢平康4 小时前
解决用 rm 报bash: /usr/bin/rm: Argument list too long错
linux·运维·运维开发
自传.4 小时前
尚硅谷 Vibe Coding|第一章 AI 编程基础理论 学习笔记
笔记·学习·尚硅谷·vibe coding
hj2862515 小时前
Linux 网络服务综合笔记(概念 + 命令 + 实操案例)2
linux·运维·网络
what_20185 小时前
Linux 磁盘 (查看、划分、inode)
linux·运维·服务器
2739920295 小时前
GDB调试(Linux)
linux
chase。6 小时前
【学习笔记】SimpleVLA-RL:通过强化学习扩展 VLA 训练
笔记·学习