批量删除pdf文件最后一页

mit ocw的讲义最后一页经常有版权标识

用这个程序可以批量删除

利用pyPDF2库

import os

from PyPDF2 import PdfReader, PdfWriter

def remove_last_page(pdf_path):

读取PDF文件

reader = PdfReader(pdf_path)

复制代码
# 如果PDF页数少于2页,直接跳过
if len(reader.pages) < 2:
    return

# 创建一个新的PDF写入对象
writer = PdfWriter()

# 将前面的所有页加入新的PDF
for i in range(len(reader.pages) - 1):
    writer.add_page(reader.pages[i])

# 覆盖原PDF文件
with open(pdf_path, 'wb') as output_pdf:
    writer.write(output_pdf)

def batch_process_pdf(folder_path):

批量处理文件夹中的PDF文件

for file_name in os.listdir(folder_path):

if file_name.endswith(".pdf"):

pdf_path = os.path.join(folder_path, file_name)

remove_last_page(pdf_path)

print(f"Processed: {file_name}")

替换为你的文件夹路径

#folder_path = 'E:\analysis\18.100c-fall-2012\static_resources'

batch_process_pdf(folder_path)

相关推荐
Mars空港10 分钟前
PDF 转换其他格式
pdf
YJlio21 分钟前
PsPing 学习笔记(14.6):直方图视图——可视化延迟分布与抖动
开发语言·笔记·python·学习·eclipse·pdf·github
paopao_wu29 分钟前
LangChainV1.0[03]-语义检索:PDF放入向量数据库
人工智能·python·langchain·pdf
我爱娃哈哈17 小时前
SpringBoot集成:5分钟实现HTML转PDF功能
spring boot·pdf·html
月巴月巴白勺合鸟月半2 天前
几种 HTML 转 PDF的方式
pdf·c#
夏日白云3 天前
《PDF解析工程实录》第 12 章|别让模型贴着墙走:为什么加一圈空白,效果反而更好?
图像处理·机器学习·pdf·llm·大语言模型·rag·文档解析
December3103 天前
新手入门指南:PDF页面方向怎么旋转?
pdf·pdf页面旋转·旋转pdf页面方向·pdf旋转
Summer不秃3 天前
使用 SnapDOM + jsPDF 生成高质量 PDF (含多页分页, 附源码)
前端·javascript·vue.js·pdf·node.js
bosins3 天前
基于Python实现PDF文件个人隐私信息检查
开发语言·python·pdf
bosins3 天前
基于Python开发PDF文件元数据查看器
开发语言·python·pdf