使用Python免费合并PDF文件

技术背景

有时候扫描文件的时候,不小心会得到多个pdf文件,常规的pdf阅读器,经常把文档合并作为一个高级付费功能。但其实通过Python的pypdf库,可以直接实现多个pdf文件的合并。

实现方案

首先需要通过pip安装pypdf:

bash 复制代码
$ python3 -m pip install pypdf

安装完成后,可以写一个py脚本,也可以像我这样直接用IPython来完成相应文件的合并(例如本地有1.pdf2.pdf两个文件):

python 复制代码
In [1]: from pypdf import PdfWriter

In [2]: merger = PdfWriter()

In [3]: pdf_files = ["/home/Data/1.pdf", "/home/Data/2.pdf"]

In [4]: for pdf in pdf_files:
   ...:     merger.append(pdf)
   ...: 

In [5]: merger.write("/home/Data/12.pdf")
Out[5]: (True, <_io.FileIO [closed]>)

In [6]: merger.close()

In [7]: exit()

完成合并后,在相应路径下会生成一个12.pdf的最终文件,这样就完成pdf文件合并了。

总结概要

本文介绍了一个使用python进行免费pdf文档合并的实现方案。使用该方案,还可以针对同一个路径下的多个文件进行合并操作,还可以利用Python的正则表达式对文件名进行筛选。综合来说,该工具对于熟练使用Python的人来说,是一大办公福音。

版权声明

本文首发链接为:https://www.cnblogs.com/dechinphy/p/pypdf.html

作者ID:DechinPhy

更多原著文章:https://www.cnblogs.com/dechinphy/

请博主喝咖啡:https://www.cnblogs.com/dechinphy/gallery/image/379634.html

相关推荐
方安乐18 小时前
python之向量、向量和、向量点积
开发语言·python·numpy
zh15702320 小时前
JavaScript中WorkerThreads解决服务端计算瓶颈
jvm·数据库·python
代码AI弗森20 小时前
一文理清楚“算力申请 / 成本测算 / 并发评估”
java·服务器·数据库
小小小米粒20 小时前
Collection单列集合、Map(Key - Value)双列集合,多继承实现。
java·开发语言·windows
蜡台21 小时前
Python包管理工具pip完全指南-----2
linux·windows·python
Mr.朱鹏21 小时前
【Python 进阶 | 第四篇】Psycopg3 + Flask 实现 PostgreSQL CRUD 全流程:从连接池到RESTful接口
python·postgresql·flask·virtualenv·fastapi·pip·tornado
摇滚侠21 小时前
expdp 查看帮助
java·数据库·oracle
czhc114007566321 小时前
C# 428 线程、异步
开发语言·c#
流年似水~21 小时前
MCP协议实战:从零搭建一个让Claude能“看见“数据库的工具服务
数据库·人工智能·程序人生·ai·ai编程
2401_8714928521 小时前
Vue.js监听器watch利用回调函数处理级联下拉框数据联动
jvm·数据库·python