使用Python免费合并PDF文件

技术背景

有时候扫描文件的时候,不小心会得到多个pdf文件,常规的pdf阅读器,经常把文档合并作为一个高级付费功能。但其实通过Python的pypdf库,可以直接实现多个pdf文件的合并。

实现方案

首先需要通过pip安装pypdf:

bash 复制代码
$ python3 -m pip install pypdf

安装完成后,可以写一个py脚本,也可以像我这样直接用IPython来完成相应文件的合并(例如本地有1.pdf2.pdf两个文件):

python 复制代码
In [1]: from pypdf import PdfWriter

In [2]: merger = PdfWriter()

In [3]: pdf_files = ["/home/Data/1.pdf", "/home/Data/2.pdf"]

In [4]: for pdf in pdf_files:
   ...:     merger.append(pdf)
   ...: 

In [5]: merger.write("/home/Data/12.pdf")
Out[5]: (True, <_io.FileIO [closed]>)

In [6]: merger.close()

In [7]: exit()

完成合并后,在相应路径下会生成一个12.pdf的最终文件,这样就完成pdf文件合并了。

总结概要

本文介绍了一个使用python进行免费pdf文档合并的实现方案。使用该方案,还可以针对同一个路径下的多个文件进行合并操作,还可以利用Python的正则表达式对文件名进行筛选。综合来说,该工具对于熟练使用Python的人来说,是一大办公福音。

版权声明

本文首发链接为:https://www.cnblogs.com/dechinphy/p/pypdf.html

作者ID:DechinPhy

更多原著文章:https://www.cnblogs.com/dechinphy/

请博主喝咖啡:https://www.cnblogs.com/dechinphy/gallery/image/379634.html

相关推荐
2401_8697695912 小时前
内容5 日期类实现
开发语言·c++
ManageEngine卓豪12 小时前
数据库可观测性:MySQL与Redis监控核心监控指标与全栈运维解决方案
数据库·redis·mysql·数据库性能·数据库监控
Rauser Mack12 小时前
不懂编程,但是vibe coding一个扫雷游戏
人工智能·python·游戏·html·prompt
白露与泡影12 小时前
2026秋招冲刺:1000道Java高频面试题(各大厂考点汇总)
java·开发语言·面试
IT龟苓膏12 小时前
Java 并发基础:进程、线程、线程状态、synchronized、volatile 一篇讲清
java·开发语言·jvm
郝学胜-神的一滴12 小时前
Python 高级编程 019:类变量与实例变量彻底解析
开发语言·python·程序人生·软件构建
真实的菜12 小时前
Redis 从入门到精通(十四):Redis 7.x 新特性全解 —— 系列收官之作
数据库·redis·缓存
哭哭啼12 小时前
pgSql 事务篇
java·数据库·postgresql
霸道流氓气质12 小时前
从MySQL到云原生:全面解析阿里云PolarDB数据库及其与MySQL的核心差异
数据库·mysql·云原生
CTA量化套保12 小时前
期货量化临期合约还能不能做:程序化到期禁开与强平写法
python·区块链