用python将pdf转成图片转换成对应的word文件

*科管系统**报告只能上传word,但是有些盖章文件只有pdf版本,因此有这个需求,目前市面上没这软件,只能自己python写一个。

要将PDF中的页面以图片的形式存储到Word文档中,你需要完成以下几个步骤:

从PDF中提取每一页的图像。

将这些图像插入到Word文档中。

这里提供一个使用Python实现的示例流程,其中使用PyMuPDF(也称为fitz)来读取PDF并提取图像,使用python-docx来创建Word文档并插入图像。

安装所需库

首先确保安装了所需的库:

pip install pymupdf python-docx

示例代码

以下是一个简单的脚本,演示如何将PDF中的页面作为图像保存,并将这些图像插入到Word文档中:

python 复制代码
import fitz  # PyMuPDF
from docx import Document
from docx.shared import Inches

def pdf_to_images(pdf_path, output_folder):
    # 打开PDF文件
    with fitz.open(pdf_path) as doc:
        # 遍历每一页
        for page_num in range(len(doc)):
            page = doc[page_num]
            # 将PDF页面渲染为图像
            pix = page.get_pixmap(dpi=300)  # dpi可以根据需要调整
            image_path = f"{output_folder}/page_{page_num + 1}.png"
            pix.save(image_path)  # 保存图像到磁盘
            yield image_path

def images_to_word(image_paths, word_path):
    # 创建一个新的Word文档
    doc = Document()
    
    # 遍历所有图像并将它们插入到Word文档中
    for image_path in image_paths:
        doc.add_picture(image_path, width=Inches(6))  # 调整宽度以适应页面
        doc.add_page_break()  # 添加一个新页面
    
    # 保存Word文档
    doc.save(word_path)

# 主函数
def main(pdf_path, output_folder, word_path):
    # 从PDF中提取图像
    image_paths = list(pdf_to_images(pdf_path, output_folder))
    
    # 将图像插入到Word文档中
    images_to_word(image_paths, word_path)

if __name__ == "__main__":
    # 定义输入输出路径
    pdf_path = 'F:\python\pdf2word\测试分册.pdf' # PDF文件路径
    output_folder = "output_images"  # 图像输出文件夹
    word_path = "output_ceshi.docx"  # Word文档输出路径
    
    # 创建输出文件夹
    import os
    if not os.path.exists(output_folder):
        os.makedirs(output_folder)
    
    # 调用主函数
    main(pdf_path, output_folder, word_path)
相关推荐
九月十九24 分钟前
java使用aspose读取word里的图片
java·word
zhangfeng113331 分钟前
Word 文件转md文件 在 Word 中没有直接将文档另存为 Markdown(.md)格式的选项,但你可以使用一些工具或手动转换来实现
word
鹏码纵横2 小时前
已解决:java.lang.ClassNotFoundException: com.mysql.jdbc.Driver 异常的正确解决方法,亲测有效!!!
java·python·mysql
仙人掌_lz2 小时前
Qwen-3 微调实战:用 Python 和 Unsloth 打造专属 AI 模型
人工智能·python·ai·lora·llm·微调·qwen3
猎人everest2 小时前
快速搭建运行Django第一个应用—投票
后端·python·django
猎人everest2 小时前
Django的HelloWorld程序
开发语言·python·django
chusheng18403 小时前
2025最新版!Windows Python3 超详细安装图文教程(支持 Python3 全版本)
windows·python·python3下载·python 安装教程·python3 安装教程
别勉.3 小时前
Python Day50
开发语言·python
xiaohanbao094 小时前
day54 python对抗生成网络
网络·python·深度学习·学习
爬虫程序猿4 小时前
利用 Python 爬虫按关键字搜索 1688 商品
开发语言·爬虫·python