Python实现将文件夹下的所有pdf文件合并成一个pdf文件,并用文件夹名字命名

Python实现将文件夹下的所有pdf文件合并成一个pdf文件,并用文件夹名字命名

python 复制代码
# -*- coding: utf-8 -*-

import os
import PyPDF2

def merge_pdfs(folder_path):
    # 获取文件夹名称
    folder_name = os.path.basename(folder_path)
    
    # 搜索文件夹内的所有PDF文件
    pdf_files = [f for f in os.listdir(folder_path) if f.endswith('.pdf')]
    
    # 按名称排序文件,确保顺序
    pdf_files.sort()

    # 创建一个PDF文件合并器对象
    pdf_merger = PyPDF2.PdfMerger()

    # 遍历所有PDF文件并将它们添加到合并器中
    for pdf_file in pdf_files:
        file_path = os.path.join(folder_path, pdf_file)
        pdf_merger.append(file_path)

    # 合并后的PDF文件保存路径
    output_path = os.path.join(os.path.dirname(folder_path), f"{folder_name}.pdf")

    # 写入合并后的PDF文件
    with open(output_path, 'wb') as output_file:
        pdf_merger.write(output_file)

    # 关闭合并器
    pdf_merger.close()

    print(f"PDFs merged into '{output_path}'")
# 设置源文件夹路径
source_dir = r''

# 确保目标文件夹存在
if not os.path.exists(source_dir):
    print(f"文件夹 {source_dir} 不存在")
    exit()
# 这里是子文件夹的子文件夹为单位进行转化的,可以根据自己需求修改
# 例如如果只需要处理一个文件夹,可以直接使用merge_pdfs(folder_path)即可
dir_1=os.listdir(source_dir)
for path1 in dir_1:
    if not os.path.isfile(source_dir+f'\{path1}'):
        dir_2=os.listdir(source_dir+f'\{path1}')
        for path2 in dir_2:
            if not os.path.isfile(source_dir+f'\{path1}'+f'\{path2}'):
                deal_dir=source_dir+f'\{path1}'+f'\{path2}'
                folder_path = deal_dir
                merge_pdfs(folder_path)
相关推荐
y先森3 小时前
CSS3中的伸缩盒模型(弹性盒子、弹性布局)之伸缩容器、伸缩项目、主轴方向、主轴换行方式、复合属性flex-flow
前端·css·css3
前端Hardy3 小时前
纯HTML&CSS实现3D旋转地球
前端·javascript·css·3d·html
susu10830189113 小时前
vue3中父div设置display flex,2个子div重叠
前端·javascript·vue.js
湫ccc4 小时前
《Python基础》之字符串格式化输出
开发语言·python
CodeCraft Studio4 小时前
【实用技能】使用 TX Text Control 创建带有嵌入式附件的 PDF 文档
pdf·asp.net·.net
mqiqe4 小时前
Python MySQL通过Binlog 获取变更记录 恢复数据
开发语言·python·mysql
AttackingLin4 小时前
2024强网杯--babyheap house of apple2解法
linux·开发语言·python
IT女孩儿4 小时前
CSS查缺补漏(补充上一条)
前端·css
哭泣的眼泪4084 小时前
解析粗糙度仪在工业制造及材料科学和建筑工程领域的重要性
python·算法·django·virtualenv·pygame
湫ccc5 小时前
《Python基础》之基本数据类型
开发语言·python