python实现多个pdf文件合并

打印发票时,需要将pdf合并成一个,单页两张打印。网上一些pdf合并逐渐收费,这玩意儿都能收费?自己写一个脚本使用。

实现代码:

输入pdf文件夹路径data_dir,统计目录下的"合并后的PDF"文件夹下,输出合并后的pdf文件。

python 复制代码
import os
import PyPDF2
import argparse

def merge_pdfs(paths, output):
    pdf_writer = PyPDF2.PdfWriter()

    for path in paths:
        pdf_reader = PyPDF2.PdfReader(path)
        for page in range(len(pdf_reader.pages)):
            pdf_writer.add_page(pdf_reader.pages[page])

    with open(output, 'wb') as out:
        pdf_writer.write(out)

def main(data_dir):
    names = os.listdir(data_dir)
    print("names:", names)

    file_paths = []
    for name in names:
        file_paths.append(os.path.join(data_dir, name))

    output = os.path.join(data_dir, "合并后的PDF/merge_%02d.pdf" % len(names))  # 合并后的PDF文件路径
    os.makedirs("./合并后的PDF", exist_ok=True)

    merge_pdfs(file_paths, output)
    print("合并后文件:", output)

def argv_parse():
    parser = argparse.ArgumentParser(usage="it's usage PyPDF2.", description="pdf merge.")
    parser.add_argument("--data_dir", type=str, help="pdf file dir.")
    return parser.parse_args()

if __name__ == "__main__":
    argv = argv_parse()
    print("argv:", argv)
    main(argv.data_dir)
相关推荐
之歆8 分钟前
Python-正则表达式-信息提取-滑动窗口-数据分发-文件加载及分析器-浏览器分析-学习笔记
python·学习·正则表达式
往日情怀酿做酒 V176392963812 分钟前
pytorch的介绍以及张量的创建
人工智能·pytorch·python
yngsqq33 分钟前
netdxf—— CAD c#二次开发之(netDxf 处理 DXF 文件)
java·前端·c#
A了LONE41 分钟前
h5的底部导航栏模板
java·前端·javascript
豌豆花下猫41 分钟前
Python 潮流周刊#110:JIT 编译器两年回顾,AI 智能体工具大爆发(摘要)
后端·python·ai
经典19921 小时前
spring boot 详解以及原理
java·spring boot·后端
星光54221 小时前
飞算JavaAI:给Java开发装上“智能引擎”的超级助手
java·开发语言
June bug1 小时前
【Python基础】变量、运算与内存管理全解析
开发语言·python·职场和发展·测试
学习3人组1 小时前
JVM GC长暂停问题排查
java
R_AirMan2 小时前
深入浅出Redis:一文掌握Redis底层数据结构与实现原理
java·数据结构·数据库·redis