Python实现将文件夹下的所有pdf文件合并成一个pdf文件,并用文件夹名字命名
python
# -*- coding: utf-8 -*-
import os
import PyPDF2
def merge_pdfs(folder_path):
# 获取文件夹名称
folder_name = os.path.basename(folder_path)
# 搜索文件夹内的所有PDF文件
pdf_files = [f for f in os.listdir(folder_path) if f.endswith('.pdf')]
# 按名称排序文件,确保顺序
pdf_files.sort()
# 创建一个PDF文件合并器对象
pdf_merger = PyPDF2.PdfMerger()
# 遍历所有PDF文件并将它们添加到合并器中
for pdf_file in pdf_files:
file_path = os.path.join(folder_path, pdf_file)
pdf_merger.append(file_path)
# 合并后的PDF文件保存路径
output_path = os.path.join(os.path.dirname(folder_path), f"{folder_name}.pdf")
# 写入合并后的PDF文件
with open(output_path, 'wb') as output_file:
pdf_merger.write(output_file)
# 关闭合并器
pdf_merger.close()
print(f"PDFs merged into '{output_path}'")
# 设置源文件夹路径
source_dir = r''
# 确保目标文件夹存在
if not os.path.exists(source_dir):
print(f"文件夹 {source_dir} 不存在")
exit()
# 这里是子文件夹的子文件夹为单位进行转化的,可以根据自己需求修改
# 例如如果只需要处理一个文件夹,可以直接使用merge_pdfs(folder_path)即可
dir_1=os.listdir(source_dir)
for path1 in dir_1:
if not os.path.isfile(source_dir+f'\{path1}'):
dir_2=os.listdir(source_dir+f'\{path1}')
for path2 in dir_2:
if not os.path.isfile(source_dir+f'\{path1}'+f'\{path2}'):
deal_dir=source_dir+f'\{path1}'+f'\{path2}'
folder_path = deal_dir
merge_pdfs(folder_path)