python将pdf转为docx

如何使用python实现将pdf文件转为docx文件

1.首先要安装pdf2docx库

python 复制代码
pip install pdf2docx

2.实现转换

python 复制代码
from pdf2docx import Converter


def convert_pdf_to_docx(input_pdf, output_docx):
    # 创建一个PDF转换器对象
    pdf_converter = Converter(input_pdf)

    # 将PDF转换为docx文件
    pdf_converter.convert(output_docx)

    # 关闭转换器以释放资源
    pdf_converter.close()


if __name__ == "__main__":
    input_pdf = "C:/Users/Windows/Desktop/test.pdf"  # 替换为自己实际的PDF文件路径
    output_docx = "C:/Users/Windows/Desktop/python.docx"  # 替换为自己实际的docx输出文件路径

    # 调用函数进行转换
    convert_pdf_to_docx(input_pdf, output_docx)
    print("PDF文件已成功转换为Word格式.")

执行成功:

之后就可以在自己输出路径下看到相应的docx文件了。

相关推荐
佳木逢钺2 分钟前
PyQt界面美化系统高级工具库:打造现代化桌面应用的完整指南
python·pyqt
2401_8796938714 分钟前
C++中的观察者模式实战
开发语言·c++·算法
工頁光軍28 分钟前
基于Python的Milvus完整使用案例
开发语言·python·milvus
Csvn28 分钟前
特殊方法与运算符重载
python
wregjru30 分钟前
【网络】8.五种 I/O 模型与多路转接详解
开发语言·php
fff98111835 分钟前
C++与Qt图形开发
开发语言·c++·算法
xht08321 小时前
PHP vs Python:编程语言终极对决
开发语言·python·php
计算机安禾1 小时前
【数据结构与算法】第3篇:C语言核心机制回顾(二):动态内存管理与typedef
c语言·开发语言·数据结构·c++·算法·链表·visual studio
23.1 小时前
【Java】char字符类型的UTF-16编码解析
java·开发语言·面试
无小道1 小时前
关于mmap的理解和使用
开发语言·mmap