python+PyMuPDF库:(三)pdf文件的选择性合并、其他格式文件转pdf

insert_file: 支持docx、xlsx、pdf、PPTX、txt、svg、xps、FB2、CBZ、EPUB、MOBI、HWPX、图片等多种格式的文件的插入。利用此方法可以将此类文件转为pdf格式的文件。

insert_pdf :用来打开pdf文件并插入。

insert_file和insert_pdf使用相同的参数,常用参数如下:

from_page,to_page 要截取的开始页和终止页,默认为-1,表示所有页

start_at 要插入到某页,默认-1,表示最后一页

rotate旋转角度

python 复制代码
from time import time
import fitz

def merge_pdf(pdf_path, pdf_names: list):
    new_doc = fitz.open()

    new_doc.insert_file(r'E:\桌面\1.jpg')

    for i, name in enumerate(pdf_names):
        file_full_path = rf'{pdf_path}\{name}'
        pdf_document = fitz.open(file_full_path)
        if i == 0:
            new_doc.insert_pdf(pdf_document, from_page=1, to_page=3, rotate=90, final=2)
        else:
            new_doc.insert_pdf(pdf_document, from_page=1, to_page=3, start_at=i, rotate=90, final=3)
        pdf_document.close()

    new_doc.save(rf'{pdf_path}\{int(time())}.pdf')
    new_doc.close()


if __name__ == '__main__':
    pdf_path = r'E:\桌面'
    pdf_names = ['91.pdf', '7.pdf', '90.pdf']
    merge_pdf(pdf_path, pdf_names)
相关推荐
Mr_Dwj4 小时前
【Python】Python 基本概念
开发语言·人工智能·python·大模型·编程语言
2401_841495645 小时前
【自然语言处理】基于规则基句子边界检测算法
人工智能·python·自然语言处理·规则·文本·语言·句子边界检测算法
E_ICEBLUE7 小时前
Python 教程:如何快速在 PDF 中添加水印(文字、图片)
开发语言·python·pdf
我爱学习_zwj7 小时前
服务器接收用户注册信息教程
python
大连滚呢王7 小时前
Linux(麒麟)服务器离线安装单机Milvus向量库
linux·python·milvus·银河麒麟·milvus_cli
PcVue China7 小时前
PcVue播客系列 - E2 | 智慧制造、人工智能与工业模拟的未来 —— 对话 Andrew Siprelle
物联网·ai·自动化·制造·数字孪生·scada·工业模拟
m0_738120727 小时前
网络安全编程——基于Python实现的SSH通信(Windows执行)
python·tcp/ip·安全·web安全·网络安全·ssh
领航猿1号8 小时前
如何通过神经网络看模型参数量?
人工智能·python·神经网络·大模型参数量