Python实现将文件夹下的所有pdf文件合并成一个pdf文件,并用文件夹名字命名

Python实现将文件夹下的所有pdf文件合并成一个pdf文件,并用文件夹名字命名

python 复制代码
# -*- coding: utf-8 -*-

import os
import PyPDF2

def merge_pdfs(folder_path):
    # 获取文件夹名称
    folder_name = os.path.basename(folder_path)
    
    # 搜索文件夹内的所有PDF文件
    pdf_files = [f for f in os.listdir(folder_path) if f.endswith('.pdf')]
    
    # 按名称排序文件,确保顺序
    pdf_files.sort()

    # 创建一个PDF文件合并器对象
    pdf_merger = PyPDF2.PdfMerger()

    # 遍历所有PDF文件并将它们添加到合并器中
    for pdf_file in pdf_files:
        file_path = os.path.join(folder_path, pdf_file)
        pdf_merger.append(file_path)

    # 合并后的PDF文件保存路径
    output_path = os.path.join(os.path.dirname(folder_path), f"{folder_name}.pdf")

    # 写入合并后的PDF文件
    with open(output_path, 'wb') as output_file:
        pdf_merger.write(output_file)

    # 关闭合并器
    pdf_merger.close()

    print(f"PDFs merged into '{output_path}'")
# 设置源文件夹路径
source_dir = r''

# 确保目标文件夹存在
if not os.path.exists(source_dir):
    print(f"文件夹 {source_dir} 不存在")
    exit()
# 这里是子文件夹的子文件夹为单位进行转化的,可以根据自己需求修改
# 例如如果只需要处理一个文件夹,可以直接使用merge_pdfs(folder_path)即可
dir_1=os.listdir(source_dir)
for path1 in dir_1:
    if not os.path.isfile(source_dir+f'\{path1}'):
        dir_2=os.listdir(source_dir+f'\{path1}')
        for path2 in dir_2:
            if not os.path.isfile(source_dir+f'\{path1}'+f'\{path2}'):
                deal_dir=source_dir+f'\{path1}'+f'\{path2}'
                folder_path = deal_dir
                merge_pdfs(folder_path)
相关推荐
JustHappy7 小时前
古法编程秘籍(七):互联网到底是什么?把两台电脑怎么说话搞懂就够了
前端·后端·网络协议
老毛肚7 小时前
jeecg-boot-base-core 02 day
javascript·python
snow@li7 小时前
SEO-文章标题:写文章时候,分类+主标题+大纲+解释 作为标题 / 不点进去也知道全文覆盖什么 / 标题即架构
前端
yaoxin5211237 小时前
434. Java 日期时间 API - Period 基于日期的时间段
java·开发语言·python
kyriewen8 小时前
Git Commit 前自动修复代码风格?配置 Husky + lint-staged,从此 CR 只聊逻辑
前端·git·面试
岁月宁静8 小时前
RAG 文档摄入全链路,从原理到生产落地
vue.js·人工智能·python
小和尚同志8 小时前
AI 自动化测试探索(一):Playwright MCP
前端·人工智能·aigc
JaydenAI8 小时前
[对比学习LangChain和MAF-07]如何引入人机交互的审批流程
python·ai·langchain·c#·agent·hitl·maf
老马识途2.08 小时前
在AI的帮助下理解spring的启动过程
java·前端·spring
徐小夕9 小时前
Loop Engineering 深度解析与实战指南(全网最全)
前端·算法·github