如何快速给PDF加书签--保姆级教程

买的电子书没有目录书签看着不舒服,手动加书签加到想吐。想有没有办法快速加书签。这要分为PDF目录部分可以被复制和不可被复制两种情况。不可复制时,要用到工具把目录提取出来,变成文字。

工具:Foxit Phantom福昕阅读器(下载链接:Foxit Phantom福昕阅读器官网)、excel、在线文字转换网址

文字可复制

观察书签的格式,想办法变成我们需要的样子

先添加两个书签,然后导出,保存在一个你能找到的地方。
打开这个书签,观察它。可以发现,它的NAME和PAGE表示的是PDF的位置和书签的名字,我们要做的就是,把这部分内容替换成我们自己的内容 思考完发现,只要我们得到这两列数据,就可以

想办法得到"目录"和"页码"两列数据

替换的宗旨就是,把目录和页码分成两列

  1. 直接复制目录到一个文本文件中

  2. 全局替换页码前的"......"为"#"(其他符号也行,但是是点号、顿号和/经常出现在目录文字描述中,不要用)

  3. 文字复制到excel中

  4. 替换技巧:先替换"...",然后替换"#."为"#",要不然会把1.2.1中的"."替换掉。最后把"##"替换为"#"。

  5. 看一遍文本,确认是目录后是#和页码,才算干净

  6. 把处理好的文本文件粘贴到excel中,然后以"#"分列,标题和页码就分成了两列。

  7. 这里的页码是书的页码,还要都加上一个数字11(前面有几页,可以根据你导出的page值和实际值对应)变成PDF的页码

  8. 然后利用excel的函数功能&把单元格中的内容拼装成书签需要的格式。公式为"=A1&A3&A5"

把目录按照一定的格式放进书签的xml中

  1. 最后一行的""先粘贴出来放个位置
  2. 用下拉的方式,复制出很多的行的格式(目录有几个行就拉几个行)
  3. 再把""粘贴到最后一行去
  4. 数据--分列--"按照空格分列",然后就把NAME和PAGE分离出来了。

接下来把我们需要的NAME和PAGE填进去

  1. 步骤5中准备好的NAME和PAGE,覆盖书签图中的B和C列,注意以"123"只粘贴值的方式粘贴
  2. 然后把excel中的内容粘贴回书签的xml中
  3. 打开书的书签,"导入书签"
  4. 分级的话,自己动手分级也挺方便

文字不可复制

用图片转文字功能,将文字提取出来,得到想要的格式。有一下几种途径:

  1. deepseek图片转文字(缺点:没页码,要自己加)
  2. https://ocr.wdku.net/,有点儿慢,但是可以在线使用
  3. 豆包等AI工具(缺点:要登录)
相关推荐
yswenli1 天前
使用Cyclops.PdfKit根据pdf模板生成pdf文件
docker·pdf·.net8
阿幸软件杂货间9 天前
Office转PDF转换器v1.0.py
开发语言·pdf·c#
reembarkation9 天前
使用pdfjs-dist 预览pdf,并添加文本层的实现
前端·javascript·pdf
reembarkation9 天前
vue-pdf 实现blob数据的预览
javascript·vue.js·pdf
Light609 天前
领码方案|Linux 下 PLT → PDF 转换服务超级完整版:异步、权限、进度(一气呵成)
linux·spring boot·pdf·gpcl6/ghostpcl·s3/oss·权限与审计·异步与进度
伟贤AI之路9 天前
【分享】中小学教材课本 PDF 资源获取指南
人工智能·pdf
东风西巷10 天前
PDFgear:免费全能的PDF处理工具
前端·pdf·软件需求
Sunny_yiyi10 天前
Java根据模版导出PDF文件
java·开发语言·pdf
小*-^-*九11 天前
php 使用html 生成pdf word wkhtmltopdf 系列2
pdf·html·php
千册11 天前
pyside6 的pdf显示测试 -- 01
开发语言·python·pdf