批量删除pdf文件最后一页

mit ocw的讲义最后一页经常有版权标识

用这个程序可以批量删除

利用pyPDF2库

import os

from PyPDF2 import PdfReader, PdfWriter

def remove_last_page(pdf_path):

读取PDF文件

reader = PdfReader(pdf_path)

复制代码
# 如果PDF页数少于2页,直接跳过
if len(reader.pages) < 2:
    return

# 创建一个新的PDF写入对象
writer = PdfWriter()

# 将前面的所有页加入新的PDF
for i in range(len(reader.pages) - 1):
    writer.add_page(reader.pages[i])

# 覆盖原PDF文件
with open(pdf_path, 'wb') as output_pdf:
    writer.write(output_pdf)

def batch_process_pdf(folder_path):

批量处理文件夹中的PDF文件

for file_name in os.listdir(folder_path):

if file_name.endswith(".pdf"):

pdf_path = os.path.join(folder_path, file_name)

remove_last_page(pdf_path)

print(f"Processed: {file_name}")

替换为你的文件夹路径

#folder_path = 'E:\analysis\18.100c-fall-2012\static_resources'

batch_process_pdf(folder_path)

相关推荐
兰文彬3 小时前
PPT转化成PDF脚本
pdf·powerpoint
@AfeiyuO8 小时前
vue3 实现将页面生成 pdf 导出(html2Canvas + jspdf)
前端·pdf·vue
小*-^-*九11 小时前
php 使用html 生成pdf word wkhtmltopdf 系列1
pdf·html·php
CodeCraft Studio18 小时前
PDF处理控件Aspose.PDF教程:使用 Python 将 PDF 转换为 Base64
开发语言·python·pdf·base64·aspose·aspose.pdf
Light6020 小时前
领码方案|Linux 下 PLT → PDF 转换服务超级完整版:异步、权限、进度
linux·pdf·可观测性·异步队列·plt转pdf·权限治理·进度查询
ftswsfb20 小时前
PDF文件基础-计算机字体
pdf
虎头金猫1 天前
如何在Linux上使用Docker在本地部署开源PDF工具Stirling PDF:StirlingPDF+cpolar让专业操作像在线文档一样简单
linux·运维·ubuntu·docker·pdf·开源·centos
拓端研究室1 天前
专题:2025人形机器人、工业机器人、智能焊接机器人、扫地机器人产业洞察报告 | 附158+份报告PDF、数据仪表盘汇总下载
microsoft·机器人·pdf
TextIn智能文档云平台1 天前
复杂PDF文档结构化提取全攻略——从OCR到大模型知识库构建
pdf·ocr
会飞的小菠菜1 天前
PDF文件中的广告二维码图片该怎么批量删除
pdf·删除·二维码·批量