Python3进行pdf文件分割及转word

今天有个pdf分割的需求,电脑装的Python3,网上查资料都是Python2的代码,所以整理一份3的

安装:

bash 复制代码
 pip install PyPDF2 
bash 复制代码
import PyPDF2

def funSplitPdf():
    pdf_file = open(
        '/path/fileName.pdf', 'rb')
    pdf_reader = PyPDF2.PdfReader(pdf_file)
    size = len(pdf_reader.pages)
    for i in range(size):
        out_pdf = PyPDF2.PdfWriter()
        out_pdf.add_page(pdf_reader.pages[i])
        out_pdf_file = open(
            '/path/fileName-'+str(i)+'.pdf',
            'wb')
        out_pdf.write(out_pdf_file)
        out_pdf.close()
if __name__ == '__main__':
    funSplitPdf()

pdf转word

安装:

bash 复制代码
 pip install pdf2docx 
bash 复制代码
import pdf2docx

def funPdf2Word():
    pdf2docx.parse('/path/fileName.pdf','/path/fileName.docx')

pdf转png

安装:

bash 复制代码
pip install  PyMuPDF
bash 复制代码
import fitz

def funPdf2Png():
    pdf_file = fitz.open('/path/fileName.pdf')
    for i in range(pdf_file.page_count):
        pdf = pdf_file[i]
        zoom_x = 1.3  # 水平方向
        zoom_y = 1.3  # 垂直方向
        mat = fitz.Matrix(zoom_x, zoom_y)
        pix = pdf.get_pixmap(matrix=mat)
        pix._writeIMG('/path/fileName-'+str(i)+'.png', 1, 1)
    pdf_file.close()
相关推荐
寻星探路5 小时前
【深度长文】万字攻克网络原理:从 HTTP 报文解构到 HTTPS 终极加密逻辑
java·开发语言·网络·python·http·ai·https
ValhallaCoder7 小时前
hot100-二叉树I
数据结构·python·算法·二叉树
猫头虎8 小时前
如何排查并解决项目启动时报错Error encountered while processing: java.io.IOException: closed 的问题
java·开发语言·jvm·spring boot·python·开源·maven
八零后琐话9 小时前
干货:程序员必备性能分析工具——Arthas火焰图
开发语言·python
青春不朽51210 小时前
Scrapy框架入门指南
python·scrapy
MZ_ZXD00110 小时前
springboot旅游信息管理系统-计算机毕业设计源码21675
java·c++·vue.js·spring boot·python·django·php
全栈老石11 小时前
Python 异步生存手册:给被 JS async/await 宠坏的全栈工程师
后端·python
梨落秋霜11 小时前
Python入门篇【模块/包】
python
阔皮大师12 小时前
INote轻量文本编辑器
java·javascript·python·c#