msys2 |arch pacman:tesseract ocr 安装 - 思源笔记自动调用

安装之后,思源笔记能自动调用,ocr识别图片中的文字,可被搜索到。

思源笔记 > 使用指南 > 资源文件 中有一些说明。

msys2安装的话:pacman -S ***tesseract***, 包括:软件本体&语言支持包

bash 复制代码
pacman -S mingw-w64-ucrt-x86_64-tesseract-ocr\
mingw-w64-ucrt-x86_64-tesseract-data-chi_sim \
mingw-w64-ucrt-x86_64-tesseract-data-chi_sim_vert \
mingw-w64-ucrt-x86_64-tesseract-data-chi_tra \
mingw-w64-ucrt-x86_64-tesseract-data-chi_tra_vert \
mingw-w64-ucrt-x86_64-tesseract-data-eng

设置环境变量:

  • PATH: tesseract.exe所在文件夹,比如C:\softwares\msys2\msys64\ucrt64\bin
  • TESSDATA_PREFIX:语言包所在文件夹,比如C:\softwares\msys2\ucrt64\share\tessdata

不设置这个可能导致ocr乱码

存在的问题:

  • 有时ocr不准
  • 有时不对某些图片执行ocr
相关推荐
linweidong2 小时前
C++ 模块化编程(Modules)在大规模系统中的实践难点?
linux·前端·c++
invicinble6 小时前
对linux形成认识
linux·运维·服务器
小Pawn爷6 小时前
14.VMmare安装ubuntu
linux·运维·ubuntu
冷雨夜中漫步6 小时前
Python快速入门(6)——for/if/while语句
开发语言·经验分享·笔记·python
半桔6 小时前
【IO多路转接】高并发服务器实战:Reactor 框架与 Epoll 机制的封装与设计逻辑
linux·运维·服务器·c++·io
HABuo7 小时前
【linux文件系统】磁盘结构&文件系统详谈
linux·运维·服务器·c语言·c++·ubuntu·centos
Howrun7777 小时前
关于Linux服务器的协作问题
linux·运维·服务器
Gain_chance8 小时前
34-学习笔记尚硅谷数仓搭建-DWS层最近一日汇总表建表语句汇总
数据仓库·hive·笔记·学习·datagrip
小白同学_C8 小时前
Lab3-page tables && MIT6.1810操作系统工程【持续更新】
linux·c/c++·操作系统os
2401_836235868 小时前
中安未来SDK15:以AI之眼,解锁企业档案的数字化基因
人工智能·科技·深度学习·ocr·生活