Umi-OCR 图片文字智能识别软件,不需联网,Linux 下运行错误修复,AI 识文一文搞定!

Umi-OCR 图片文字智能识别软件,不需联网,Linux 下运行除错修复,AI 识文一文搞定!

Umi-OCR 是一款开源的图片文字只能识别软件,支持多国语言识别,支持截图OCR / 批量OCR / PDF识别 / 二维码 / 公式识别。

支持批量图片格式识别: jpg, jpe, jpeg, jfif, png, webp, bmp, tif, tiff

支持批量文档格式识别: pdf, xps, epub, mobi, fb2, cbz

官网:https://github.com/hiroi-sora/Umi-OCR/releases/

1.下载安装
bash 复制代码
wget https://github.com/hiroi-sora/Umi-OCR/releases/download/v2.1.3/Umi-OCR_Debian_x64_Paddle_2.1.3.tar.xz
tar xvf ./Umi-OCR_Debian_x64_Paddle_2.1.3.tar.xz
cd Umi-OCR_Debian_x64_Paddle_2.1.3
./umi-ocr.sh

运行出错

Warning: Ignoring XDG_SESSION_TYPE=wayland on Gnome. Use QT_QPA_PLATFORM=wayland to run on Wayland anyway.

qt.qpa.plugin: Could not find the Qt platform plugin "xcb" in ""

This application failed to start because no Qt platform plugin could be initialized. Reinstalling the application may fix this problem.

./umi-ocr.sh: 第 26 行: 259469 已中止 (核心已转储) python3 UmiOCR-data/main_linux.py "$@"

安装依赖包

bash 复制代码
sudo apt install libxcb-xinerama0

注意:umi-oci 程序存放绝对路径里不能有中文,否则也会报上述错误!比如~/下载/Umi-OCR_Debian_x64_Paddle_2.1.3这样包含中文路径名的就不行,重新存放到英文路径名下。

重新运行

识别结果

2.添加桌面快捷方式
bash 复制代码
nano ~/.local/share/applications/umi-ocr.desktop

添加以下内容,执行路径根据自己的路径修改:

bash 复制代码
[Desktop Entry]
Name=Umi-OCR 文字识别
Exec=/home/edsolo/soft/Umi-OCR_Debian_x64_Paddle_2.1.3/umi-ocr.sh
Icon=/home/edsolo/soft/Umi-OCR_Debian_x64_Paddle_2.1.3/docs/images/icon-256.png
Type=Application
Terminal=false

添加执行权限

bash 复制代码
chmod +x ~/.local/share/applications/umi-ocr.desktop

程序就出现在程序菜单栏里了。

3.截屏黑屏问题

在使用 Wayland 显示服务器协议时,截屏时屏幕是黑的,只能截取到纯黑的图像。

修复

切换为XOrg显示服务器:

复制代码
nano /etc/gdm3/custom.conf

找到#WaylandEnable=false,取消#注释,保存,重启电脑。

强烈建议

自带的截图功能不好用,建议安装Snipaste截图工具,自定义区域,快捷方便。

Snipaste 安装 -->:
Snipaste 安装不能使用问题解决

相关推荐
编码者卢布23 分钟前
【Azure Storage Account】Azure Table Storage 跨区批量迁移方案
后端·python·flask
可触的未来,发芽的智生27 分钟前
狂想:为AGI代称造字ta,《第三类智慧存在,神的赐名》
javascript·人工智能·python·神经网络·程序人生
大佐不会说日语~31 分钟前
使用Docker Compose 部署时网络冲突问题排查与解决
运维·网络·spring boot·docker·容器
Kira Skyler34 分钟前
eBPF debugfs中的追踪点format实现原理
linux
吴维炜1 小时前
「Python算法」计费引擎系统SKILL.md
python·算法·agent·skill.md·vb coding
2501_927773071 小时前
uboot挂载
linux·运维·服务器
FansyMeng2 小时前
VSCode配置anaconda
vscode·python
wdfk_prog2 小时前
[Linux]学习笔记系列 -- [drivers][dma]dmapool
linux·笔记·学习
电饭叔2 小时前
Tkinter Button 括号内的核心参数详解
python·学习
Tim风声(网络工程师)2 小时前
防火墙-长链接、介绍作用
运维·服务器·网络