pdf文件脱敏处理(1)-扫描版本的PDF

今日项目对接,甲方要求提供个人与公司签署的合同扫描 PDF 文件。合同内包含薪资等敏感隐私信息,需要做脱敏处理。市面各类在线 PDF 脱敏工具大多收费高昂,且处理效果粗糙、排版易错乱,并不适用。

其实 PDF 工具普遍收费,核心原因在于:PDF 属于固定版式文档,底层仅存储坐标、字体、图形信息,并无标准文字段落结构;加上 PDF 官方规范繁杂庞大,同时存在大量闭源私有格式,还要兼容加密 PDF、扫描图片 PDF、双层 PDF、矢量内容、公式排版、内嵌字体等各类场景,技术研发、格式适配、长期迭代维护成本极高。

而扫描件类 PDF 本质就是图片格式,无需复杂 PDF 底层解析,直接提取页面图片、对敏感区域做涂抹遮挡,再重新合成 PDF 即可,全程本地免费处理,安全便捷、不留痕迹。

我写了一个读取图片的小工具:

工具下载地址:【免费】pdf内容提取图片提取资源-CSDN下载https://download.csdn.net/download/hanbo79/92821082

相关推荐
2501_907136822 小时前
ColorPdfSpliter 将 PDF 分为黑白和彩色页面,支持单双面打印
pdf·软件需求
私人珍藏库2 小时前
[Windows] Iobit Uninstall_v15.4.0.1
windows·软件·win·多功能
xunyan62342 小时前
WSL无法联网
windows·ubuntu
【ql君】qlexcel2 小时前
批量获取word内的图片
word·图片·图片提取·批量获取·word图片
Full Stack Developme2 小时前
Hutool JSON 操作教程
windows·python·json
kirs_ur3 小时前
Windows系统怎么看文件的MD5
运维·服务器·windows
其实秋天的枫3 小时前
【26年考研408】考研计算机408统考历年真题及答案解析PDF电子版(2009-2026年)
经验分享·pdf
Full Stack Developme3 小时前
Hutool File 教程
linux·windows·python
逆向爱好者3 小时前
windows环境下通过docker安装使用Superset
windows·docker·容器