使用Python免费合并PDF文件

技术背景

有时候扫描文件的时候,不小心会得到多个pdf文件,常规的pdf阅读器,经常把文档合并作为一个高级付费功能。但其实通过Python的pypdf库,可以直接实现多个pdf文件的合并。

实现方案

首先需要通过pip安装pypdf:

bash 复制代码
$ python3 -m pip install pypdf

安装完成后,可以写一个py脚本,也可以像我这样直接用IPython来完成相应文件的合并(例如本地有1.pdf2.pdf两个文件):

python 复制代码
In [1]: from pypdf import PdfWriter

In [2]: merger = PdfWriter()

In [3]: pdf_files = ["/home/Data/1.pdf", "/home/Data/2.pdf"]

In [4]: for pdf in pdf_files:
   ...:     merger.append(pdf)
   ...: 

In [5]: merger.write("/home/Data/12.pdf")
Out[5]: (True, <_io.FileIO [closed]>)

In [6]: merger.close()

In [7]: exit()

完成合并后,在相应路径下会生成一个12.pdf的最终文件,这样就完成pdf文件合并了。

总结概要

本文介绍了一个使用python进行免费pdf文档合并的实现方案。使用该方案,还可以针对同一个路径下的多个文件进行合并操作,还可以利用Python的正则表达式对文件名进行筛选。综合来说,该工具对于熟练使用Python的人来说,是一大办公福音。

版权声明

本文首发链接为:https://www.cnblogs.com/dechinphy/p/pypdf.html

作者ID:DechinPhy

更多原著文章:https://www.cnblogs.com/dechinphy/

请博主喝咖啡:https://www.cnblogs.com/dechinphy/gallery/image/379634.html

相关推荐
古城小栈几秒前
Rust 已经自举,却仍需GNU与MSVC工具链的缘由
开发语言·rust
正在走向自律1 分钟前
金仓数据库KingbaseES基础语法详解与实践指南
数据库·国产数据库·ddl·dml·kingbasees·sql语法·电科金仓
alonewolf_992 分钟前
MySQL全局优化详解与8.0新特性全面解读
数据库·mysql
vyuvyucd2 分钟前
MPPI算法实战:机器人避障与仿真
python
计算机徐师兄3 分钟前
Python基于Flask的广东旅游数据分析系统(附源码,文档说明)
python·flask·旅游数据分析·广东旅游数据分析系统·python广东数据分析系统·python广东旅游数据分析·python旅游数据分析系统
ASS-ASH4 分钟前
快速处理虚拟机磁盘扩容问题
linux·数据库·vmware·虚拟机·磁盘扩容
jarreyer5 分钟前
数据项目分析标准化流程
开发语言·python·机器学习
GZKPeng7 分钟前
pytorch +cuda成功安装后, torch.cuda.is_available 是False
人工智能·pytorch·python
你怎么知道我是队长8 分钟前
C语言---printf函数使用详细说明
c语言·开发语言
我的xiaodoujiao9 分钟前
使用 Python 语言 从 0 到 1 搭建完整 Web UI自动化测试学习系列 39--生成 Allure测试报告
python·学习·测试工具·pytest