Python3进行pdf文件分割及转word

今天有个pdf分割的需求,电脑装的Python3,网上查资料都是Python2的代码,所以整理一份3的

安装:

bash 复制代码
 pip install PyPDF2 
bash 复制代码
import PyPDF2

def funSplitPdf():
    pdf_file = open(
        '/path/fileName.pdf', 'rb')
    pdf_reader = PyPDF2.PdfReader(pdf_file)
    size = len(pdf_reader.pages)
    for i in range(size):
        out_pdf = PyPDF2.PdfWriter()
        out_pdf.add_page(pdf_reader.pages[i])
        out_pdf_file = open(
            '/path/fileName-'+str(i)+'.pdf',
            'wb')
        out_pdf.write(out_pdf_file)
        out_pdf.close()
if __name__ == '__main__':
    funSplitPdf()

pdf转word

安装:

bash 复制代码
 pip install pdf2docx 
bash 复制代码
import pdf2docx

def funPdf2Word():
    pdf2docx.parse('/path/fileName.pdf','/path/fileName.docx')

pdf转png

安装:

bash 复制代码
pip install  PyMuPDF
bash 复制代码
import fitz

def funPdf2Png():
    pdf_file = fitz.open('/path/fileName.pdf')
    for i in range(pdf_file.page_count):
        pdf = pdf_file[i]
        zoom_x = 1.3  # 水平方向
        zoom_y = 1.3  # 垂直方向
        mat = fitz.Matrix(zoom_x, zoom_y)
        pix = pdf.get_pixmap(matrix=mat)
        pix._writeIMG('/path/fileName-'+str(i)+'.png', 1, 1)
    pdf_file.close()
相关推荐
C嘎嘎嵌入式开发16 小时前
NLP 入门:从原理到实战的个人经验总结
人工智能·python·自然语言处理·nlp
咖啡の猫16 小时前
Python字典元素的增、删、改操作
java·开发语言·python
Swizard16 小时前
Python 并不慢,是你看不懂:拆解 CPython 虚拟机背后的魔法引擎
python
自由生长202416 小时前
一次“虚拟环境复制引发的血案”:记一次 itsdangerous 版本混乱排查全过程
python
天下不喵17 小时前
python项目部署之pytandic与.env的使用教程
python·docker
shenzhenNBA17 小时前
python如何调用AI之deepseek的API接口?
人工智能·python·deepseek·调用deepseek api
咖啡の猫17 小时前
Python集合的创建
python·哈希算法·散列表
maogewang17 小时前
清朝条约史料三册合辑:从尼布楚到辛丑条约的完整 PDF 文献汇编
pdf
LitchiCheng17 小时前
Mujoco 使用 Pinocchio 进行逆动力学及阻抗力矩控制维持当前位置
人工智能·python
殇者知忧17 小时前
凯斯西储(CWRU)数据集解读与数据读取
python·凯斯西储(cwru)数据集