批量删除pdf文件最后一页

mit ocw的讲义最后一页经常有版权标识

用这个程序可以批量删除

利用pyPDF2库

import os

from PyPDF2 import PdfReader, PdfWriter

def remove_last_page(pdf_path):

读取PDF文件

reader = PdfReader(pdf_path)

复制代码
# 如果PDF页数少于2页,直接跳过
if len(reader.pages) < 2:
    return

# 创建一个新的PDF写入对象
writer = PdfWriter()

# 将前面的所有页加入新的PDF
for i in range(len(reader.pages) - 1):
    writer.add_page(reader.pages[i])

# 覆盖原PDF文件
with open(pdf_path, 'wb') as output_pdf:
    writer.write(output_pdf)

def batch_process_pdf(folder_path):

批量处理文件夹中的PDF文件

for file_name in os.listdir(folder_path):

if file_name.endswith(".pdf"):

pdf_path = os.path.join(folder_path, file_name)

remove_last_page(pdf_path)

print(f"Processed: {file_name}")

替换为你的文件夹路径

#folder_path = 'E:\analysis\18.100c-fall-2012\static_resources'

batch_process_pdf(folder_path)

相关推荐
夏日白云20 小时前
《PDF解析工程实录》第 12 章|别让模型贴着墙走:为什么加一圈空白,效果反而更好?
图像处理·机器学习·pdf·llm·大语言模型·rag·文档解析
December3101 天前
新手入门指南:PDF页面方向怎么旋转?
pdf·pdf页面旋转·旋转pdf页面方向·pdf旋转
Summer不秃1 天前
使用 SnapDOM + jsPDF 生成高质量 PDF (含多页分页, 附源码)
前端·javascript·vue.js·pdf·node.js
bosins1 天前
基于Python实现PDF文件个人隐私信息检查
开发语言·python·pdf
bosins1 天前
基于Python开发PDF文件元数据查看器
开发语言·python·pdf
2501_946213901 天前
Zettlr(科研笔记) v4.0.0 中文免费版
java·经验分享·笔记·pdf·github·ocr·开源软件
java_logo1 天前
MinerU Docker 部署指南:PDF 结构化解析服务实践
docker·容器·pdf·mineru·mineru部署·mineru部署文档·mineru部署教程
夏日白云2 天前
《PDF解析工程实录》第 11 章|图像路线的工程现实:DPI、分辨率和内存炸裂
pdf·llm·大语言模型·rag·文档解析
拓端研究室2 天前
2026年消费行业展望报告:智能科技、可持续发展与幼稚经济|附750+份报告PDF、数据、可视化模板汇总下载
科技·pdf
December3102 天前
EPUB转PDF实用指南,减少格式错乱烦恼
pdf·文档格式转换·电子书转pdf·epub转pdf·电子书转换格式