【PDF合并】利用 Python 合并 PDF 文件

依赖安装

复制代码
pip install PyPDF2

在 Python 中,可以使用 PyPDF2 模块来合并多个 PDF 文件。

复制代码
from PyPDF2 import PdfFileMerger

# 创建一个 PdfFileMerger 对象
merger = PdfFileMerger()

# 添加要合并的 PDF 文件
pdf_files = ['file1.pdf', 'file2.pdf', 'file3.pdf']
for pdf_file in pdf_files:
    merger.append(pdf_file)

# 指定输出文件路径
output_path = 'merged.pdf'

# 执行合并操作
merger.write(output_path)

# 关闭 PdfFileMerger 对象
merger.close()

首先导入 PdfFileMerger 类。接下来,创建一个 PdfFileMerger 对象 merger。

然后,使用 append 方法逐个添加要合并的 PDF 文件。在示例中,将要合并的 PDF 文件路径存储在列表 pdf_files 中,可以根据实际情况进行修改。

在添加完所有的 PDF 文件后,需要指定合并后的输出文件路径 output_path。

最后,调用 write 方法执行合并操作,并使用 close 方法关闭 PdfFileMerger 对象。

执行上述代码后,将会生成一个名为 merged.pdf 的文件,其中包含了所有合并的 PDF 文件的内容。

如果提示

复制代码
PyPDF2.errors.DeprecationError: PdfFileMerger is deprecated and was removed in PyPDF2 3.0.0. Use PdfMerger instead.

则是由于

在 PyPDF2 版本 3.0.0 中,PdfFileMerger 类被移除了,取而代之的是 PdfMerger 类。

复制代码
from PyPDF2 import PdfMerger

# 创建一个 PdfMerger 对象
merger = PdfMerger()

# 添加要合并的 PDF 文件
pdf_files = ['file1.pdf', 'file2.pdf', 'file3.pdf']
for pdf_file in pdf_files:
    merger.append(pdf_file)

# 指定输出文件路径
output_path = 'merged.pdf'

# 执行合并操作
merger.write(output_path)

# 关闭 PdfMerger 对象
merger.close()
相关推荐
Muyuan19988 小时前
27.RAG 系统中的上下文充分性判断:从 Chunk 数量、FAISS 距离到 LLM Relevance Gate
python·django·pdf·fastapi·faiss
开开心心就好14 小时前
近200个工具的电脑故障修复合集
安全·智能手机·pdf·电脑·consul·memcache·1024程序员节
其实秋天的枫14 小时前
2026年初中英语大纲词汇表1600词
经验分享·pdf
开开心心_Every15 小时前
轻量级PDF阅读器,仅几M大小打开秒开
linux·运维·服务器·安全·macos·pdf·phpstorm
福大大架构师每日一题16 小时前
ragflow v0.25.1 最新版发布:API 统一、PDF 解析性能大幅优化、连接器删除同步全面增强,更新要点一次看懂
pdf·ragflow
cosinmz2 天前
图片太多太乱怎么整理?分享一个我最近常用的图片转 PDF方法
经验分享·小程序·pdf
其实秋天的枫2 天前
2026年新高考英语大纲词汇表3500个电子版PDF(含正序版、乱序版和默写版)
经验分享·pdf
lijfrank2 天前
MacOS 下 VS Code + LaTeX + Skim 双向同步配置
vscode·macos·pdf·latex·mactex
程序员的记录2 天前
AI 实战 - 文档处理(pdf/work/md/txt...)
pdf
Muyuan19982 天前
22.让 RAG Agent 更像真实产品:聊天页面优化、PDF 上传、知识库重建与检索片段展示
python·django·pdf·fastapi