PDF工具箱/合并拆分pdf/提取图片

PDF神器功能很全:编辑书签、页面裁剪、解除限制、合并拆分PDF、分析文档、提取图片......

核心功能一览:

  • PDF信息修改

    支持修改文档属性、页码编号、页面链接、页面尺寸;可删除自动打开网页等动作,并解除文档的复制与打印限制,自由设置阅读器初始视图模式。

  • 书签智能编辑与管理

    • 内置阅读界面,支持从右至左的竖排阅读模式。

    • 可批量修改书签颜色、样式、目标页码与缩放比例。

    • 支持正则表达式与XPath匹配,实现查找替换、快速定位章节书签。

    • 自动识别文档标题或目录,一键生成书签。

  • 文档合并与生成

    • 合并多个PDF文件或图片,生成新PDF,并保留原书签或挂接新书签。

    • 支持自定义书签文本与样式,也可根据文件名自动生成。

  • 页面管理与提取

    • 自由提取、删除指定页面,调整页面顺序。

    • 拆分或合并PDF文件,并保留书签结构。

  • 图片处理与识别

    • 高速无损导出PDF内嵌图片。

    • 调用微软Office OCR引擎识别图片中文字,将图片目录转换为书签,识别结果可直接写入PDF。

  • 字体与排版优化

    • 替换文档字体或嵌入外部字库,解决复制乱码问题,确保文档在无内置字库的设备(如Kindle)上正常显示。
  • 文档结构分析

    • 以树形视图展示PDF结构,支持编辑文档节点,也可导出为XML文件,便于分析与调试。

源代码的结构

    • Common:一些常用的工具类

    • Functions:用于呈现软件各类功能的窗体和控件

    • Lib:程序使用的第三方组件

    • Model:编辑文档时所用的高级模型(基础数据模型由 iText 和 MuPDF 的类实现)

    • Options:程序的选项

    • Processor:处理 PDF 文档的算法(其中 Mupdf 目录里放置了 P/Invoke 调用 MuPDF 的类)

  • doc 目录:放置程序的使用文档

  • JBig2 目录:放置 JBIG2 图像的编码和解码库代码

具有以下功能:

  • 修改文档(带"*"号部分功能需通过高级补丁修改功能实现):

    • PDF书签编辑器:带有阅读器界面,可添加、修改或删除PDF文档的书签,可批量设置书签的文字颜色、打开或收拢状态、点击后的跳转位置及页面缩放比例、替换书签文本等。

    • 书签编辑器的阅读器界面支持从右到左的阅读顺序,便于阅读传统竖排书籍。

    • 更改阅读器的初始设置(如显示比例、界面等)。

    • 统一所有页面的尺寸。

    • 添加或更改PDF文档的逻辑页码编号。

    • 替换PDF文档中的字库。

    • 在批量修改文档功能选项中,可批量修改文档属性(如作者、主题、关键词等)。支持通过文件名重写文档属性。

    • 删除文档或页面内嵌的XML元数据。
    • 删除打开文档或页面时自动执行的动作。
    • 去除PDF文件复制、打印、批注等限制。
    • 裁剪或扩大部分页面尺寸。*
    • 调整页面旋转方向。*
    • 添加或修改页面内的链接。*
  • 高级补丁修改功能(分两步进行)。

    • 首先导出信息文件(将PDF文档属性、阅读器初始状态、页码设置、页面设置、书签等信息导出成可编辑的XML文件。如原文档没有书签,还可分析文档文本,自动生成书签信息文件。
    • 导入信息文件生成新文件:将上述信息文件和已有PDF文件合并,生成新的PDF文档,该PDF文档具有XML信息文件的设置(如页面设置、书签等)。
  • 制作PDF文件:通过导入一批图片或已有PDF文件,生成包含图片及已有PDF文件指定页面范围的PDF文件(可挂上书签)。此功能还可拆分或合并PDF文件,并保留原文件的书签。

  • 自动生成PDF书签:通过抽取 PDF 中符合指定条件的文本,自动生成 PDF 书签。即使是数千页的文档,也可以在几分钟内完成书签的制作过程,再也不需要手动一个个添加书签。

  • 识别图片PDF文档的文字:

  • 高速无损导出PDF文件的图片。

  • 提取PDF文件中指定的页面,可使用多种方式拆分文档。拆分的文档可保留原文档的书签。

  • 根据PDF文档元数据重命名PDF文件名。

  • 修复乱码书签及文档属性。

  • 分析文档结构:将PDF文档导出成XML文件供PDF爱好者分析、调试之用。 文档结构探查器,分析 PDF 文档结构。

运行环境

  • Windows 7 以上版本的操作系统。

  • .NET Framework 4.0 到 4.8 版本。

  • 使用文字识别功能需要安装 Microsoft Office 2003(或 2007)的 Document Imaging 组件(MODI)。

  • 编译程序源代码,建议使用 Visual Studio 2022 或更新版本,并安装".NET 桌面开发"(用于编译 PDF 源代码)和"C++ 桌面开发"(用于编译 JBIG2 编码组件)两个工作负载。可能会遇到项目"面向不再受支持的 .NET Framework"、需要"将目标更新为 .NET Framework 4.8"的问题。简单方法是将目标更新为 .NET Framework 4.8。

  • 源码及软件下载地址详见:https://shendian.cloud/?m=home\&c=View\&a=index\&aid=156

下载安装及说明文档

  1. 下载:最新正式版 1.1.3.4663 (已提速,推荐下载) 或最新测试版 1.2.0.4691(密码:8518)。

    解压到硬盘后,运行其中的"PDFPatcher.exe"文件。如程序打开PDF文档时崩溃,请尝试删掉安装目录下的 vcruntime140.dll 和 msvcp140.dll 两个文件,下载并安装Visual C++ 运行库。

  2. 下载 PDF使用手册(0.3.3.100版,最新版暂无文档)

    注:本软件的使用手册是好多年前写下的,里面很多功能在新版本中有更简便的操作方法

相关推荐
michaelzhouh2 小时前
php项目ueditor上传pdf文件,防止XSS攻击
pdf·php·xss·ueditor
#麻辣小龙虾#3 小时前
网页Iframe读取PDF文件的参数设置
pdf
baivfhpwxf20233 小时前
要在 WPF 中实现数据表对应实体的属性与 UI 控件的双向绑定,并支持修改通知和 UI 自动更新
c#·wpf
秋月的私语4 小时前
代码自动生成文本小工具TextStringizerWpf
c#
葛小白14 小时前
Winform控件:Chart
c#·winform·chart
好望角雾眠13 小时前
第四阶段C#通讯开发-9:网络协议Modbus下的TCP与UDP
网络·笔记·网络协议·tcp/ip·c#·modbus
我是苏苏15 小时前
C#基础:如何从现有类库复制一个新的类库,并且加入解决方案
开发语言·c#
Jackson@ML19 小时前
用Visual Studio Code最新版开发C#应用程序
ide·vscode·c#
她说彩礼65万20 小时前
C# 代理模式
开发语言·c#·代理模式