使用Python免费合并PDF文件

技术背景

有时候扫描文件的时候,不小心会得到多个pdf文件,常规的pdf阅读器,经常把文档合并作为一个高级付费功能。但其实通过Python的pypdf库,可以直接实现多个pdf文件的合并。

实现方案

首先需要通过pip安装pypdf:

bash 复制代码
$ python3 -m pip install pypdf

安装完成后,可以写一个py脚本,也可以像我这样直接用IPython来完成相应文件的合并(例如本地有1.pdf2.pdf两个文件):

python 复制代码
In [1]: from pypdf import PdfWriter

In [2]: merger = PdfWriter()

In [3]: pdf_files = ["/home/Data/1.pdf", "/home/Data/2.pdf"]

In [4]: for pdf in pdf_files:
   ...:     merger.append(pdf)
   ...: 

In [5]: merger.write("/home/Data/12.pdf")
Out[5]: (True, <_io.FileIO [closed]>)

In [6]: merger.close()

In [7]: exit()

完成合并后,在相应路径下会生成一个12.pdf的最终文件,这样就完成pdf文件合并了。

总结概要

本文介绍了一个使用python进行免费pdf文档合并的实现方案。使用该方案,还可以针对同一个路径下的多个文件进行合并操作,还可以利用Python的正则表达式对文件名进行筛选。综合来说,该工具对于熟练使用Python的人来说,是一大办公福音。

版权声明

本文首发链接为:https://www.cnblogs.com/dechinphy/p/pypdf.html

作者ID:DechinPhy

更多原著文章:https://www.cnblogs.com/dechinphy/

请博主喝咖啡:https://www.cnblogs.com/dechinphy/gallery/image/379634.html

相关推荐
XDHCOM19 小时前
ORA-32484重复列名错误,ORACLE数据库CYCLE子句故障修复与远程处理方案
数据库·oracle
Csvn20 小时前
🌟 LangChain 30 天保姆级教程 · Day 13|OutputParser 进阶!让 AI 输出自动转为结构化对象,并支持自动重试!
python·langchain
Wenweno0o20 小时前
0基础Go语言Eino框架智能体实战-chatModel
开发语言·后端·golang
翻斗包菜20 小时前
PostgreSQL 日常维护完全指南:从基础操作到高级运维
运维·数据库·postgresql
其实秋天的枫20 小时前
【2026年最新】驾考科目一考试题库2309道电子版pdf
经验分享·pdf
呆瑜nuage20 小时前
MySQL表约束详解:8大核心约束实战指南
数据库·mysql
chenjingming66620 小时前
jmeter线程组设置以及串行和并行设置
java·开发语言·jmeter
liliangcsdn20 小时前
Agent Memory智能体记忆系统的示例分析
数据库·人工智能·全文检索
cch891820 小时前
Python主流框架全解析
开发语言·python
那个失眠的夜20 小时前
Mybatis延迟加载策略
xml·java·数据库·maven·mybatis