Python实现将文件夹下的所有pdf文件合并成一个pdf文件，并用文件夹名字命名

小怪兽会微笑2024-04-20 11:02

Python实现将文件夹下的所有pdf文件合并成一个pdf文件，并用文件夹名字命名

python 复制代码

# -*- coding: utf-8 -*-

import os
import PyPDF2

def merge_pdfs(folder_path):
    # 获取文件夹名称
    folder_name = os.path.basename(folder_path)
    
    # 搜索文件夹内的所有PDF文件
    pdf_files = [f for f in os.listdir(folder_path) if f.endswith('.pdf')]
    
    # 按名称排序文件，确保顺序
    pdf_files.sort()

    # 创建一个PDF文件合并器对象
    pdf_merger = PyPDF2.PdfMerger()

    # 遍历所有PDF文件并将它们添加到合并器中
    for pdf_file in pdf_files:
        file_path = os.path.join(folder_path, pdf_file)
        pdf_merger.append(file_path)

    # 合并后的PDF文件保存路径
    output_path = os.path.join(os.path.dirname(folder_path), f"{folder_name}.pdf")

    # 写入合并后的PDF文件
    with open(output_path, 'wb') as output_file:
        pdf_merger.write(output_file)

    # 关闭合并器
    pdf_merger.close()

    print(f"PDFs merged into '{output_path}'")
# 设置源文件夹路径
source_dir = r''

# 确保目标文件夹存在
if not os.path.exists(source_dir):
    print(f"文件夹 {source_dir} 不存在")
    exit()
# 这里是子文件夹的子文件夹为单位进行转化的，可以根据自己需求修改
# 例如如果只需要处理一个文件夹,可以直接使用merge_pdfs(folder_path)即可
dir_1=os.listdir(source_dir)
for path1 in dir_1:
    if not os.path.isfile(source_dir+f'\{path1}'):
        dir_2=os.listdir(source_dir+f'\{path1}')
        for path2 in dir_2:
            if not os.path.isfile(source_dir+f'\{path1}'+f'\{path2}'):
                deal_dir=source_dir+f'\{path1}'+f'\{path2}'
                folder_path = deal_dir
                merge_pdfs(folder_path)