使用Python免费合并PDF文件

技术背景

有时候扫描文件的时候,不小心会得到多个pdf文件,常规的pdf阅读器,经常把文档合并作为一个高级付费功能。但其实通过Python的pypdf库,可以直接实现多个pdf文件的合并。

实现方案

首先需要通过pip安装pypdf:

bash 复制代码
$ python3 -m pip install pypdf

安装完成后,可以写一个py脚本,也可以像我这样直接用IPython来完成相应文件的合并(例如本地有1.pdf2.pdf两个文件):

python 复制代码
In [1]: from pypdf import PdfWriter

In [2]: merger = PdfWriter()

In [3]: pdf_files = ["/home/Data/1.pdf", "/home/Data/2.pdf"]

In [4]: for pdf in pdf_files:
   ...:     merger.append(pdf)
   ...: 

In [5]: merger.write("/home/Data/12.pdf")
Out[5]: (True, <_io.FileIO [closed]>)

In [6]: merger.close()

In [7]: exit()

完成合并后,在相应路径下会生成一个12.pdf的最终文件,这样就完成pdf文件合并了。

总结概要

本文介绍了一个使用python进行免费pdf文档合并的实现方案。使用该方案,还可以针对同一个路径下的多个文件进行合并操作,还可以利用Python的正则表达式对文件名进行筛选。综合来说,该工具对于熟练使用Python的人来说,是一大办公福音。

版权声明

本文首发链接为:https://www.cnblogs.com/dechinphy/p/pypdf.html

作者ID:DechinPhy

更多原著文章:https://www.cnblogs.com/dechinphy/

请博主喝咖啡:https://www.cnblogs.com/dechinphy/gallery/image/379634.html

相关推荐
孟健5 小时前
Karpathy 用 200 行纯 Python 从零实现 GPT:代码逐行解析
python
码路飞7 小时前
写了个 AI 聊天页面,被 5 种流式格式折腾了一整天 😭
javascript·python
倔强的石头_7 小时前
kingbase备份与恢复实战(二)—— sys_dump库级逻辑备份与恢复(Windows详细步骤)
数据库
曲幽9 小时前
FastAPI压力测试实战:Locust模拟真实用户并发及优化建议
python·fastapi·web·locust·asyncio·test·uvicorn·workers
敏编程14 小时前
一天一个Python库:jsonschema - JSON 数据验证利器
python
前端付豪14 小时前
LangChain记忆:通过Memory记住上次的对话细节
人工智能·python·langchain
databook14 小时前
ManimCE v0.20.1 发布:LaTeX 渲染修复与动画稳定性提升
python·动效
花酒锄作田1 天前
使用 pkgutil 实现动态插件系统
python
前端付豪1 天前
LangChain链 写一篇完美推文?用SequencialChain链接不同的组件
人工智能·python·langchain
曲幽1 天前
FastAPI实战:打造本地文生图接口,ollama+diffusers让AI绘画更听话
python·fastapi·web·cors·diffusers·lcm·ollama·dreamshaper8·txt2img