msys2 |arch pacman:tesseract ocr 安装 - 思源笔记自动调用

安装之后,思源笔记能自动调用,ocr识别图片中的文字,可被搜索到。

思源笔记 > 使用指南 > 资源文件 中有一些说明。

msys2安装的话:pacman -S ***tesseract***, 包括:软件本体&语言支持包

bash 复制代码
pacman -S mingw-w64-ucrt-x86_64-tesseract-ocr\
mingw-w64-ucrt-x86_64-tesseract-data-chi_sim \
mingw-w64-ucrt-x86_64-tesseract-data-chi_sim_vert \
mingw-w64-ucrt-x86_64-tesseract-data-chi_tra \
mingw-w64-ucrt-x86_64-tesseract-data-chi_tra_vert \
mingw-w64-ucrt-x86_64-tesseract-data-eng

设置环境变量:

  • PATH: tesseract.exe所在文件夹,比如C:\softwares\msys2\msys64\ucrt64\bin
  • TESSDATA_PREFIX:语言包所在文件夹,比如C:\softwares\msys2\ucrt64\share\tessdata

不设置这个可能导致ocr乱码

存在的问题:

  • 有时ocr不准
  • 有时不对某些图片执行ocr
相关推荐
songyuc几秒前
【BiFormer】BiFormer: Vision Transformer with Bi-Level Routing Attention 译读笔记
笔记·transformer
Trouvaille ~21 分钟前
【Linux】TCP Socket编程实战(一):API详解与单连接Echo Server
linux·运维·服务器·网络·c++·tcp/ip·socket
觉醒大王23 分钟前
强女思维:着急,是贪欲外显的相。
java·论文阅读·笔记·深度学习·学习·自然语言处理·学习方法
三水不滴32 分钟前
计网:输入网址到网页显示
经验分享·笔记·计算机网络
小白狮ww38 分钟前
要给 OCR 装个脑子吗?DeepSeek-OCR 2 让文档不再只是扫描
人工智能·深度学习·机器学习·ocr·cpu·gpu·deepseek
旖旎夜光1 小时前
Linux(13)(中)
linux·网络
威迪斯特2 小时前
CentOS图形化操作界面:理论解析与实践指南
linux·运维·centos·组件·图形化·桌面·xserver
一方热衷.2 小时前
在线安装对应版本NVIDIA驱动
linux·运维·服务器
独自归家的兔2 小时前
ubuntu系统安装dbswitch教程 - 备份本地数据到远程服务器
linux·运维·ubuntu
ONE_SIX_MIX2 小时前
ubuntu 24.04 用rdp连接,桌面黑屏问题,解决
linux·运维·ubuntu