批量删除pdf文件最后一页

mit ocw的讲义最后一页经常有版权标识

用这个程序可以批量删除

利用pyPDF2库

import os

from PyPDF2 import PdfReader, PdfWriter

def remove_last_page(pdf_path):

读取PDF文件

reader = PdfReader(pdf_path)

复制代码
# 如果PDF页数少于2页,直接跳过
if len(reader.pages) < 2:
    return

# 创建一个新的PDF写入对象
writer = PdfWriter()

# 将前面的所有页加入新的PDF
for i in range(len(reader.pages) - 1):
    writer.add_page(reader.pages[i])

# 覆盖原PDF文件
with open(pdf_path, 'wb') as output_pdf:
    writer.write(output_pdf)

def batch_process_pdf(folder_path):

批量处理文件夹中的PDF文件

for file_name in os.listdir(folder_path):

if file_name.endswith(".pdf"):

pdf_path = os.path.join(folder_path, file_name)

remove_last_page(pdf_path)

print(f"Processed: {file_name}")

替换为你的文件夹路径

#folder_path = 'E:\analysis\18.100c-fall-2012\static_resources'

batch_process_pdf(folder_path)

相关推荐
w2018005 小时前
申论答题纸模板大作文格子纸及行测答题卡PDF可打印
pdf
2401_876964138 小时前
27考研396经济类联考历年真题PDF
考研·pdf
2401_8769641310 小时前
27唐迟阅读方法论|思维导图PDF
pdf
2401_8769641310 小时前
27唐迟长难句的逻辑PDF
pdf
Web打印12 小时前
HttpPrinter(web打印控件)的gridreport和Fastreport对 ☑、★、✓ 等 Unicode 符号的支持
chrome·pdf·web
Web打印12 小时前
HttpPrinter(web打印控件)的gridreport导出pdf,字体模糊的解决方法
pdf
Web打印14 小时前
2027年Web打印的几种方法
前端·pdf·web
庖丁AI15 小时前
PDF表格提取工具怎么选?普通转换、OCR和解析工具的区别
pdf·ocr
索西引擎15 小时前
【LangChain 1.0】 语义搜索实战:从 PDF 文档到向量知识库的完整 RAG 链路
langchain·pdf