Linux笔记--基于OCRmyPDF将扫描件PDF转换为可搜索的PDF

1--官方仓库

https://github.com/ocrmypdf/OCRmyPDF

2--基本步骤

bash 复制代码
# 安装ocrmypdf库
sudo apt install ocrmypdf

# 安装简体中文库
sudo apt-get install tesseract-ocr-chi-sim

# 转换
# -l 表示使用的语言
# --force-ocr 防止出现以下错误:ERROR - PriorOcrFoundError: page already has text! - aborting (use --force-ocr to force OCR)
# input.pdf 表示待转换的pdf
# output.pdf 表示转换后保存的pdf
ocrmypdf -l chi_sim input.pdf output.pdf --force-ocr

3--常见错误

Error1:

ERROR - PriorOcrFoundError: page already has text! - aborting (use --force-ocr to force OCR)

Solution:

添加--force-ocr

ocrmypdf -l chi_sim input.pdf output3.pdf --force-ocr

相关推荐
bantinghy2 小时前
Linux系统TCP/IP网络参数优化
linux·网络·tcp/ip
星期天要睡觉2 小时前
Linux 综合练习
linux·运维·服务器
saynaihe2 小时前
proxmox8升级到proxmox9
linux·运维·服务器
Orchestrator_me3 小时前
CentOS交换区处理
linux·运维·centos
zru_96023 小时前
centos 系统如何安装open jdk 8
java·linux·centos
FLS1683 小时前
VMwaer虚拟机安装完Centos后无法联网问题
linux·运维·centos
OctopusMonster3 小时前
centos下gdb调试python的core文件
linux·运维·centos
snowfoootball4 小时前
(自用)Linux 常用命令自查文档
linux·运维·服务器
R-G-B4 小时前
Linux常见命令总结 合集二:基本命令、目录操作命令、文件操作命令、压缩文件操作、查找命令、权限命令、其他命令
linux·基本命令·目录操作命令·linux常见命令·压缩文件操作·权限命令·查找命令
Chukai1234 小时前
Windows 和 Linux 系统下修改防火墙机制开放端口
linux·运维·windows