Python实现将文件夹下的所有pdf文件合并成一个pdf文件,并用文件夹名字命名

在Python中,可以使用PyPDF2库来合并PDF文件。以下是一个简单的脚本,它将指定文件夹下的所有PDF文件合并成一个PDF文件,并使用文件夹的名字进行命名:

首先,确保你已经安装了PyPDF2库。如果没有安装,可以通过以下命令安装:

pip install PyPDF2

然后,你可以使用以下脚本来合并PDF文件:

复制代码
import os
from PyPDF2 import PdfMerger

def merge_pdfs_in_folder(folder_path, output_filename):
    # 获取文件夹下所有的PDF文件
    pdf_files = [os.path.join(folder_path, f) for f in os.listdir(folder_path) if f.endswith('.pdf')]
    
    # 按照文件名排序,确保合并的顺序
    pdf_files.sort()
    
    # 初始化PDF合并器
    merger = PdfMerger()
    
    # 添加所有的PDF文件到合并器中
    for pdf_file in pdf_files:
        merger.append(pdf_file)
    
    # 合并PDF并保存到指定的文件中
    merger.write(output_filename)
    merger.close()

    # 打印完成信息
    print(f'PDF files have been merged into {output_filename}')

# 设置文件夹路径和输出文件名
folder_path = 'path_to_your_folder'  # 替换为你的文件夹路径
output_filename = os.path.join(folder_path, os.path.basename(folder_path) + '.pdf')  # 使用文件夹名字命名输出文件

# 调用函数合并PDF文件
merge_pdfs_in_folder(folder_path, output_filename)

请确保将folder_path变量替换为你的PDF文件所在的文件夹路径。

这个脚本首先会找到指定文件夹下所有的PDF文件,然后按照文件名的自然顺序对它们进行排序,以确保合并时的顺序是正确的。接着,它使用PdfMerger对象来合并这些文件,并将合并后的PDF保存为指定的输出文件名。

注意:PyPDF2库在处理某些PDF文件时可能会遇到问题,特别是那些使用了高级压缩或加密的PDF。如果遇到问题,你可能需要寻找其他的PDF处理库,如pdfrwPyMuPDF

相关推荐
w20180018 小时前
一至六年级下册数学第五单元测试卷(人教版+苏教版)
pdf
w20180020 小时前
人教版小学一至六年级下册语文期中考试试卷PDF可打印
pdf
w2018001 天前
小学一至六年级下册数学期中考试试卷PDF(人教版+苏教版+冀教版+北师版)
pdf
yivifu1 天前
使用PyMuPDF基于对PDF文档内容的分析自动识别并删除PDF文件中的水印
python·pdf·pymupdf·去水印
tanis_20771 天前
PDF 解析后输出什么格式?MinerU 五类下游场景的选型指南
人工智能·pdf·csdn开发云
tanis_20771 天前
扫描版中文 PDF 怎么提取文字:用 MinerU 做 OCR + 结构化一体处理
人工智能·pdf·ocr
tanis_20771 天前
MinerU2.5-Pro 中文 PDF 识别准确率全解:OmniDocBench v1.6 权威基准数据
人工智能·python·pdf
小林敲代码77882 天前
基于 PDFBox 的 PDF 水印管理:使用 OCG 层实现精准添加与一键去除
pdf
tanis_20772 天前
学术论文 PDF 的版面自动还原:MinerU 对多栏排版、浮动图表与脚注区域的识别实战
人工智能·pdf·ocr
tanis_20772 天前
从 PDF 中精准提取表格、图片与公式:MinerU 结构化元素抽取的 3 种方案
pdf