window电脑上使用python将pdf转换为word文档

1、电脑上安装Python运行环境

一、python官网下载链接

二、下载到电脑后,直接运行安装

三、安装完成后按:win+R键进入window命令控制窗口,输入

powershell 复制代码
	python --version

2、设置python依赖包国内镜像源

powershell 复制代码
pip config set global.index-url https://mirrors.aliyun.com/pypi/simple/

3.以下代码选用一种,在电脑上的某一个目录下新建python代码文件,并在window窗口中安装对应依赖

第一种:pdf2doc_pdf2docx.py(推荐)

powershell 复制代码
pip install pdf2docx
python 复制代码
from pdf2docx import Converter


# 最轻量,效果不错,推荐!!
# 安装依赖命令:pip install pdf2docx

# 转换函数
def pdf_to_word(pdf_file_path, word_file_path):
    # 创建一个 PDF 转换器
    cv = Converter(pdf_file_path)

    # 转换 PDF 文件为 Word 文档
    cv.convert(word_file_path, start=0, end=None)

    # 关闭转换器
    cv.close()

    # 转换完成,docx_file 是生成的word文档
    print(f'pdf转docx成功 {pdf_file_path} to {word_file_path}')


if __name__ == '__main__':
    # 指定 PDF 文件路径
    pdf_file = 'C:\\Users\\kaka\\Desktop\\pdf\\高级Java开发工程师.pdf'
    # 输出 Word 文件路径
    docx_file = 'C:\\Users\\kaka\\Desktop\\Desktop\\pdf\\高级Java开发工程师.docx'

    # 调用函数进行转换
    pdf_to_word(pdf_file, docx_file)

运行示例:

第一步

第二步

powershell 复制代码
python C:\Users\kaka\PycharmProjects\flaskProject\test\pdf2doc_pdf2docx.py

第三步,回车运行就可以了

第二种:pdf2doc_office.py

python 复制代码
import office

# 依赖包较大,但功能比较全;官网:https://www.python-office.com/
# 安装依赖命令:pip install python-office

if __name__ == '__main__':
    # 指定 PDF 文件路径
    pdf_file = 'C:\\Users\\kaka\\Desktop\\pdf\\高级Java开发工程师.pdf'
    # 输出 Word 文件路径,不用写文件名
    docx_file = 'C:\\Users\\kaka\\Desktop\\pdf'

    office.pdf.pdf2docx(file_path=pdf_file, output_path=docx_file)

    print("PDF 转换成功")

第三种:pdf2doc_office.py

python 复制代码
from spire.pdf import PdfDocument
from spire.pdf import FileFormat


# 最轻量,效果不错,推荐!!
# 安装依赖命令:pip install Spire.PDF

def pdf_to_word(pdf_path, path_doc, path_docx):
    # 创建一个 PDF 文档对象
    document = PdfDocument()
    # 加载 PDF 文件
    document.LoadFromFile(pdf_path)

    # 将PDF文件直接转换为Doc文件并保存
    document.SaveToFile(path_doc, FileFormat.DOC)

    # 将PDF文件直接转换为Docx文件并保存
    document.SaveToFile(path_docx, FileFormat.DOCX)

    # 关闭 PDF 文档
    document.Close()

    print("PDF 转换成功")


if __name__ == '__main__':
    # 指定 PDF 文件路径和输出 Word 文件路径
    pdf_file = 'C:\\Users\\kaka\\Desktop\\pdf\\高级Java开发工程师.pdf'
    word_file_doc = 'C:\\Users\\kaka\\Desktop\\pdf\\PDF转DOC.doc'
    word_file_docx = 'C:\\Users\\kaka\\Desktop\\pdf\\PDF转DOCX.docx'

    # 调用函数进行转换
    pdf_to_word(pdf_file, word_file_doc, word_file_docx)
相关推荐
顾林海2 小时前
Agent入门阶段-编程基础-Python:流程控制
python·agent·ai编程
呱呱复呱呱5 小时前
Django CBV 源码解读:一个请求是怎么找到你的 get() 方法的
python·django
曲幽10 小时前
刚部署的 LibreTranslate 频频翻车?我掏出了 20 年前的 StarDict 词典,用 FastAPI 搭了个本地词典翻译 API
python·fastapi·web·translate·goldendict·libretranslate·stardict·pystardict
荣码10 小时前
用Streamlit给AI应用套个界面,10行代码出Web页面
java·python
兵慌码乱20 小时前
基于Python+PyQt5+SQLite的药房管理系统实现:事务一致性与界面解耦全流程解析
python·sqlite·信号与槽·pyqt5·数据库设计·桌面应用开发·事务处理
金銀銅鐵21 小时前
[Python] 体验用欧几里得算法计算最大公约数的过程
python·数学
FreakStudio1 天前
W55MH32L-EVB 上手测评:硬件 TCP/IP 加持的以太网单片机,MicroPython 零门槛开发
python·单片机·嵌入式·大学生·面向对象·并行计算·电子diy·电子计算机
用户0332126663671 天前
使用 Python 从零创建 Word 文档
python
Csvn1 天前
Python 两大经典坑点 —— 可变默认参数 & 闭包延迟绑定
后端·python
曲幽1 天前
别再用网页翻译看源码了!你的私人翻译神器LibreTranslate,部署避坑指南来了
python·docker·web·pot·translate·libretranslate·arogstranslate