pdf merge

在 Ubuntu 22.04 上,你可以使用以下命令行工具来合并多个 PDF 文件:

1. pdftk

pdftk 是一个强大的 PDF 工具,支持合并、拆分和其他操作。安装和使用方法如下:

bash 复制代码
sudo apt install pdftk
pdftk file1.pdf file2.pdf cat output merged.pdf

2. pdfunite(推荐)

pdfunite 是一个简单且高效的工具,通常是 poppler-utils 包的一部分。安装和使用方法如下:

bash 复制代码
sudo apt install poppler-utils
pdfunite file1.pdf file2.pdf file3.pdf merged.pdf

3. ghostscript

Ghostscript 是一个功能强大的工具,也支持 PDF 合并操作。使用方法如下:

bash 复制代码
sudo apt install ghostscript
gs -dBATCH -dNOPAUSE -q -sDEVICE=pdfwrite -sOutputFile=merged.pdf file1.pdf file2.pdf file3.pdf

4. qpdf

qpdf 是一个灵活的 PDF 工具,支持加密、解密和合并等功能。合并 PDF 的方法如下:

bash 复制代码
sudo apt install qpdf
qpdf --empty --pages file1.pdf file2.pdf -- merged.pdf

5. Python 脚本

如果你熟悉 Python,可以使用 PyPDF2pikepdf 库进行合并。示例代码如下:

bash 复制代码
pip install PyPDF2
python 复制代码
from PyPDF2 import PdfMerger

merger = PdfMerger()
for pdf in ["file1.pdf", "file2.pdf", "file3.pdf"]:
    merger.append(pdf)
merger.write("merged.pdf")
merger.close()

哪个工具适合你?

  • 如果需要简单易用,pdfunite 是首选。
  • 如果需要更多功能,pdftkghostscript 是更灵活的选择。
  • 如果你需要用脚本实现自动化,Python 是不错的选择。

你可以使用工具来解除PDF的密码保护,从而避免每次都需要输入密码的麻烦。以下是一些常用的方法和工具:


方法 1:使用 qpdf

qpdf 是一个开源的命令行工具,适合处理PDF文件,包括移除密码保护。

步骤:
  1. 安装 qpdf

    • Ubuntu/Debian :

      bash 复制代码
      sudo apt install qpdf
    • Mac (Homebrew) :

      bash 复制代码
      brew install qpdf
    • Windows : 下载 qpdf 并安装。

  2. 使用以下命令移除密码:

    bash 复制代码
    qpdf --password=你的密码 --decrypt 输入文件.pdf 输出文件.pdf

    例子:

    bash 复制代码
    qpdf --password=123456 --decrypt protected.pdf unprotected.pdf

方法 2:使用 pdftk

pdftk 也是一个命令行工具,用于处理PDF文件。

步骤:
  1. 安装 pdftk

    • Ubuntu/Debian :

      bash 复制代码
      sudo apt install pdftk
    • Mac (Homebrew) :

      bash 复制代码
      brew install pdftk-java
    • Windows : 下载 pdftk 并安装。

  2. 使用以下命令移除密码:

    bash 复制代码
    pdftk 输入文件.pdf input_pw 你的密码 output 输出文件.pdf

    例子:

    bash 复制代码
    pdftk protected.pdf input_pw 123456 output unprotected.pdf

方法 3:在线工具(适合非敏感文件)

如果文件不涉及敏感信息,你可以使用一些在线工具来移除密码,例如:

注意事项:
  • 上传前确保文件内容不会泄露。
  • 不建议对包含敏感信息的PDF使用此方法。

方法 4:使用 Adobe Acrobat(付费工具)

Adobe Acrobat 的完整版本支持解密功能。

步骤:
  1. 用密码打开PDF。
  2. 导航到 文件 > 属性 > 安全性
  3. 更改安全性方法为 无安全性
  4. 保存文件。

以上方法可以帮你去掉PDF的密码保护,推荐使用 qpdfpdftk,因为它们是免费的命令行工具且支持自动化操作。


要使用qpdf合并多个PDF文件,你可以使用以下命令:

bash 复制代码
qpdf --empty --pages *.pdf -- output.pdf

这个命令会将当前目录下的所有PDF文件合并到一个名为output.pdf的文件中。


要合并特定的PDF文件,比如1-6个文件,而不包括7-8,你可以使用qpdf命令行工具,并指定你想要合并的文件。假设你的文件名是file1.pdffile2.pdf,以此类推,你可以使用以下命令:

bash 复制代码
qpdf --empty --pages file1.pdf file2.pdf file3.pdf file4.pdf file5.pdf file6.pdf -- output.pdf

这个命令会将file1.pdffile6.pdf合并到一个名为output.pdf的文件中,而不会包括file7.pdffile8.pdf

如果文件名的格式不同,确保在命令中使用正确的文件名即可。


相关推荐
只可远观3 分钟前
Python解释器和PyCharm详解
开发语言·python
zi__you6 分钟前
【Python网络爬虫笔记】10- os库存储爬取数据
笔记·爬虫·python
z千鑫19 分钟前
【Flask+OpenAI】利用Flask+OpenAI Key实现GPT4-智能AI对话接口demo - 从0到1手把手全教程(附源码)
人工智能·后端·python·chatgpt·flask·ai编程
ALISHENGYA1 小时前
Python基础经典编程练习题,含答案
python·算法
Krorainas1 小时前
将PDF流使用 canvas 绘制然后转为图片展示在页面上(二)
前端·javascript·pdf·react
宽广1 小时前
java aspose word 模板根据数据导出pdf
java·开发语言·pdf·c#·word
码猩1 小时前
VBA 连续打印多个内容成PDF
java·服务器·pdf
浅醉樱花雨1 小时前
python 基于 docx 文件模板生成 docx 或 PDF 文件
python·pdf·docx·word模板
数据小爬虫@2 小时前
利用Python爬虫技术获取商品销量详情
开发语言·爬虫·python