【PDF合并】利用 Python 合并 PDF 文件

依赖安装

复制代码
pip install PyPDF2

在 Python 中,可以使用 PyPDF2 模块来合并多个 PDF 文件。

复制代码
from PyPDF2 import PdfFileMerger

# 创建一个 PdfFileMerger 对象
merger = PdfFileMerger()

# 添加要合并的 PDF 文件
pdf_files = ['file1.pdf', 'file2.pdf', 'file3.pdf']
for pdf_file in pdf_files:
    merger.append(pdf_file)

# 指定输出文件路径
output_path = 'merged.pdf'

# 执行合并操作
merger.write(output_path)

# 关闭 PdfFileMerger 对象
merger.close()

首先导入 PdfFileMerger 类。接下来,创建一个 PdfFileMerger 对象 merger。

然后,使用 append 方法逐个添加要合并的 PDF 文件。在示例中,将要合并的 PDF 文件路径存储在列表 pdf_files 中,可以根据实际情况进行修改。

在添加完所有的 PDF 文件后,需要指定合并后的输出文件路径 output_path。

最后,调用 write 方法执行合并操作,并使用 close 方法关闭 PdfFileMerger 对象。

执行上述代码后,将会生成一个名为 merged.pdf 的文件,其中包含了所有合并的 PDF 文件的内容。

如果提示

复制代码
PyPDF2.errors.DeprecationError: PdfFileMerger is deprecated and was removed in PyPDF2 3.0.0. Use PdfMerger instead.

则是由于

在 PyPDF2 版本 3.0.0 中,PdfFileMerger 类被移除了,取而代之的是 PdfMerger 类。

复制代码
from PyPDF2 import PdfMerger

# 创建一个 PdfMerger 对象
merger = PdfMerger()

# 添加要合并的 PDF 文件
pdf_files = ['file1.pdf', 'file2.pdf', 'file3.pdf']
for pdf_file in pdf_files:
    merger.append(pdf_file)

# 指定输出文件路径
output_path = 'merged.pdf'

# 执行合并操作
merger.write(output_path)

# 关闭 PdfMerger 对象
merger.close()
相关推荐
李小白杂货铺12 小时前
从基于pdf2htmlEX技术的PDF预览页面提取原始PDF文件的方法原理与实践
pdf·自动化脚本·pdf预览页面·提取pdf文件·自动化提取pdf脚本·pdf2htmlex·原始pdf文件
小许好楠12 小时前
【itext操作pdf】
pdf
aFakeProgramer18 小时前
PDF文档拆分办公工具
pdf
reasonsummer18 小时前
【办公类-125-01】20260106期末资料多个docx合并成一个PDF打印(单数页+1空白页,双数页不变)
python·pdf
YJlio20 小时前
Sysinternals 学习笔记(15.0):系统信息工具总览——RAMMap、RU、CoreInfo 等一网打尽
开发语言·笔记·python·学习·django·pdf·硬件架构
私人珍藏库20 小时前
[吾爱大神原创工具] 【PDF去除水印的工具】可视化操作界面,支持区域删除和文字删除两种模式
pdf
杨浦老苏20 小时前
PDF图书馆索引器和阅读器Inkheart
docker·pdf·群晖·电子书
薛定谔的猫198221 小时前
RAG(四) LangChain 使用PyPDFLoader加载 PDF 并实现内容总结功能
langchain·pdf·php
小粉粉hhh21 小时前
记录前端菜鸟的日常——Pdf.js与双指缩放
前端·javascript·pdf
weixin_4368040721 小时前
在线媒体预览工具 - 免下载查看图片视频音频PDF
pdf·音视频·媒体