mit ocw的讲义最后一页经常有版权标识
用这个程序可以批量删除
利用pyPDF2库
import os
from PyPDF2 import PdfReader, PdfWriter
def remove_last_page(pdf_path):
读取PDF文件
reader = PdfReader(pdf_path)
# 如果PDF页数少于2页,直接跳过
if len(reader.pages) < 2:
return
# 创建一个新的PDF写入对象
writer = PdfWriter()
# 将前面的所有页加入新的PDF
for i in range(len(reader.pages) - 1):
writer.add_page(reader.pages[i])
# 覆盖原PDF文件
with open(pdf_path, 'wb') as output_pdf:
writer.write(output_pdf)
def batch_process_pdf(folder_path):
批量处理文件夹中的PDF文件
for file_name in os.listdir(folder_path):
if file_name.endswith(".pdf"):
pdf_path = os.path.join(folder_path, file_name)
remove_last_page(pdf_path)
print(f"Processed: {file_name}")
替换为你的文件夹路径
#folder_path = 'E:\analysis\18.100c-fall-2012\static_resources'
batch_process_pdf(folder_path)