Python3进行pdf文件分割及转word

今天有个pdf分割的需求,电脑装的Python3,网上查资料都是Python2的代码,所以整理一份3的

安装:

bash 复制代码
 pip install PyPDF2 
bash 复制代码
import PyPDF2

def funSplitPdf():
    pdf_file = open(
        '/path/fileName.pdf', 'rb')
    pdf_reader = PyPDF2.PdfReader(pdf_file)
    size = len(pdf_reader.pages)
    for i in range(size):
        out_pdf = PyPDF2.PdfWriter()
        out_pdf.add_page(pdf_reader.pages[i])
        out_pdf_file = open(
            '/path/fileName-'+str(i)+'.pdf',
            'wb')
        out_pdf.write(out_pdf_file)
        out_pdf.close()
if __name__ == '__main__':
    funSplitPdf()

pdf转word

安装:

bash 复制代码
 pip install pdf2docx 
bash 复制代码
import pdf2docx

def funPdf2Word():
    pdf2docx.parse('/path/fileName.pdf','/path/fileName.docx')

pdf转png

安装:

bash 复制代码
pip install  PyMuPDF
bash 复制代码
import fitz

def funPdf2Png():
    pdf_file = fitz.open('/path/fileName.pdf')
    for i in range(pdf_file.page_count):
        pdf = pdf_file[i]
        zoom_x = 1.3  # 水平方向
        zoom_y = 1.3  # 垂直方向
        mat = fitz.Matrix(zoom_x, zoom_y)
        pix = pdf.get_pixmap(matrix=mat)
        pix._writeIMG('/path/fileName-'+str(i)+'.png', 1, 1)
    pdf_file.close()
相关推荐
鸽芷咕22 分钟前
DrissionPage 成 CANN 仓库爆款自动化工具:背后原因何在?
运维·python·自动化·cann
爱学习的阿磊23 分钟前
使用Fabric自动化你的部署流程
jvm·数据库·python
少云清43 分钟前
【金融项目实战】7_接口测试 _代码实现接口测试(重点)
python·金融项目实战
深蓝电商API44 分钟前
爬虫IP封禁后的自动切换与检测机制
爬虫·python
m0_550024631 小时前
持续集成/持续部署(CI/CD) for Python
jvm·数据库·python
B站_计算机毕业设计之家1 小时前
豆瓣电影数据采集分析推荐系统 | Python Vue Flask框架 LSTM Echarts多技术融合开发 毕业设计源码 计算机
vue.js·python·机器学习·flask·echarts·lstm·推荐算法
渣渣苏1 小时前
Langchain实战快速入门
人工智能·python·langchain
lili-felicity2 小时前
CANN模型量化详解:从FP32到INT8的精度与性能平衡
人工智能·python
数据知道2 小时前
PostgreSQL实战:详解如何用Python优雅地从PG中存取处理JSON
python·postgresql·json
ZH15455891312 小时前
Flutter for OpenHarmony Python学习助手实战:面向对象编程实战的实现
python·学习·flutter