Python3进行pdf文件分割及转word

今天有个pdf分割的需求,电脑装的Python3,网上查资料都是Python2的代码,所以整理一份3的

安装:

bash 复制代码
 pip install PyPDF2 
bash 复制代码
import PyPDF2

def funSplitPdf():
    pdf_file = open(
        '/path/fileName.pdf', 'rb')
    pdf_reader = PyPDF2.PdfReader(pdf_file)
    size = len(pdf_reader.pages)
    for i in range(size):
        out_pdf = PyPDF2.PdfWriter()
        out_pdf.add_page(pdf_reader.pages[i])
        out_pdf_file = open(
            '/path/fileName-'+str(i)+'.pdf',
            'wb')
        out_pdf.write(out_pdf_file)
        out_pdf.close()
if __name__ == '__main__':
    funSplitPdf()

pdf转word

安装:

bash 复制代码
 pip install pdf2docx 
bash 复制代码
import pdf2docx

def funPdf2Word():
    pdf2docx.parse('/path/fileName.pdf','/path/fileName.docx')

pdf转png

安装:

bash 复制代码
pip install  PyMuPDF
bash 复制代码
import fitz

def funPdf2Png():
    pdf_file = fitz.open('/path/fileName.pdf')
    for i in range(pdf_file.page_count):
        pdf = pdf_file[i]
        zoom_x = 1.3  # 水平方向
        zoom_y = 1.3  # 垂直方向
        mat = fitz.Matrix(zoom_x, zoom_y)
        pix = pdf.get_pixmap(matrix=mat)
        pix._writeIMG('/path/fileName-'+str(i)+'.png', 1, 1)
    pdf_file.close()
相关推荐
量化投资技术3 分钟前
【量化科普】Liquidity,流动性
python·量化交易·量化·量化投资·qmt·miniqmt
EterNity_TiMe_27 分钟前
【人工智能】蓝耘智算平台盛大发布DeepSeek满血版:开创AI推理体验新纪元
人工智能·python·机器学习·deepseek
顾德拉科1 小时前
使用pyinstaller对gradio和chromadb进行打包
python
java1234_小锋1 小时前
一周学会Flask3 Python Web开发-redirect重定向
前端·python·flask·flask3
重生之我要成为代码大佬1 小时前
Python天梯赛10分题-念数字、求整数段和、比较大小、计算阶乘和
开发语言·数据结构·python·算法
Daitu_Adam1 小时前
Windows11安装GPU版本Pytorch2.6教程
人工智能·pytorch·python·深度学习
阿正的梦工坊2 小时前
Grouped-Query Attention(GQA)详解: Pytorch实现
人工智能·pytorch·python
码界筑梦坊2 小时前
基于Flask的短视频流量数据可视化系统的设计与实现
大数据·python·信息可视化·flask·毕业设计
eso19832 小时前
Spark MLlib使用流程简介
python·算法·spark-ml·推荐算法
dme.3 小时前
Python爬虫基础文件操作
爬虫·python