Python实现将文件夹下的所有pdf文件合并成一个pdf文件,并用文件夹名字命名

Python实现将文件夹下的所有pdf文件合并成一个pdf文件,并用文件夹名字命名

python 复制代码
# -*- coding: utf-8 -*-

import os
import PyPDF2

def merge_pdfs(folder_path):
    # 获取文件夹名称
    folder_name = os.path.basename(folder_path)
    
    # 搜索文件夹内的所有PDF文件
    pdf_files = [f for f in os.listdir(folder_path) if f.endswith('.pdf')]
    
    # 按名称排序文件,确保顺序
    pdf_files.sort()

    # 创建一个PDF文件合并器对象
    pdf_merger = PyPDF2.PdfMerger()

    # 遍历所有PDF文件并将它们添加到合并器中
    for pdf_file in pdf_files:
        file_path = os.path.join(folder_path, pdf_file)
        pdf_merger.append(file_path)

    # 合并后的PDF文件保存路径
    output_path = os.path.join(os.path.dirname(folder_path), f"{folder_name}.pdf")

    # 写入合并后的PDF文件
    with open(output_path, 'wb') as output_file:
        pdf_merger.write(output_file)

    # 关闭合并器
    pdf_merger.close()

    print(f"PDFs merged into '{output_path}'")
# 设置源文件夹路径
source_dir = r''

# 确保目标文件夹存在
if not os.path.exists(source_dir):
    print(f"文件夹 {source_dir} 不存在")
    exit()
# 这里是子文件夹的子文件夹为单位进行转化的,可以根据自己需求修改
# 例如如果只需要处理一个文件夹,可以直接使用merge_pdfs(folder_path)即可
dir_1=os.listdir(source_dir)
for path1 in dir_1:
    if not os.path.isfile(source_dir+f'\{path1}'):
        dir_2=os.listdir(source_dir+f'\{path1}')
        for path2 in dir_2:
            if not os.path.isfile(source_dir+f'\{path1}'+f'\{path2}'):
                deal_dir=source_dir+f'\{path1}'+f'\{path2}'
                folder_path = deal_dir
                merge_pdfs(folder_path)
相关推荐
半青年14 分钟前
单例模式:全局唯一性在软件设计中的艺术实践
java·c++·python·单例模式
LaughingZhu22 分钟前
PH热榜 | 2025-04-26
前端·数据库·人工智能·mysql·开源
fen_fen1 小时前
Miniconda Windows10版本下载和安装
python
kyle~1 小时前
深度学习---Pytorch概览
人工智能·pytorch·python·深度学习
老胖闲聊5 小时前
Python PyAutoGUI库【GUI 自动化库】深度解析与实战指南
python
萌萌哒草头将军6 小时前
⚡⚡⚡尤雨溪宣布开发 Vite Devtools,这两个很哇塞 🚀 Vite 的插件,你一定要知道!
前端·vue.js·vite
GeekABC7 小时前
FastAPI系列06:FastAPI响应(Response)
开发语言·python·fastapi·web
小彭努力中7 小时前
7.Three.js 中 CubeCamera详解与实战示例
开发语言·前端·javascript·vue.js·ecmascript
fen_fen7 小时前
Python3:Jupyter Notebook 安装和配置
ide·python·jupyter
浪裡遊8 小时前
跨域问题(Cross-Origin Problem)
linux·前端·vue.js·后端·https·sprint