python将pdf转为docx

如何使用python实现将pdf文件转为docx文件

1.首先要安装pdf2docx库

python 复制代码
pip install pdf2docx

2.实现转换

python 复制代码
from pdf2docx import Converter


def convert_pdf_to_docx(input_pdf, output_docx):
    # 创建一个PDF转换器对象
    pdf_converter = Converter(input_pdf)

    # 将PDF转换为docx文件
    pdf_converter.convert(output_docx)

    # 关闭转换器以释放资源
    pdf_converter.close()


if __name__ == "__main__":
    input_pdf = "C:/Users/Windows/Desktop/test.pdf"  # 替换为自己实际的PDF文件路径
    output_docx = "C:/Users/Windows/Desktop/python.docx"  # 替换为自己实际的docx输出文件路径

    # 调用函数进行转换
    convert_pdf_to_docx(input_pdf, output_docx)
    print("PDF文件已成功转换为Word格式.")

执行成功:

之后就可以在自己输出路径下看到相应的docx文件了。

相关推荐
大圣编程4 分钟前
面向对象深度理解
java·开发语言·算法
爱喝水的鱼丶10 分钟前
SAP-ABAP:SAP 简单报表输出开发系列(共6篇) 第四篇:SAP 报表异常处理机制:数据校验与消息提示规范落地
开发语言·数据库·学习·算法·sap·abap
影寂ldy11 分钟前
C# const 常量 / readonly 只读 / static readonly
java·开发语言·c#
C+-C资深大佬27 分钟前
在PyCharm中创建虚拟环境的具体步骤是什么?
ide·python·pycharm
iCxhust40 分钟前
c#多串口重量采集上位机程序
开发语言·汇编·c#·微机原理·8088单板机
QK_001 小时前
volatile 关键字核心作用
开发语言
Dxy12393102161 小时前
Python Tensor 向量入门:从零理解深度学习的“数据语言“
开发语言·python·深度学习
林森lsjs1 小时前
【日耕一题】3. 通过键盘输入一行字符,分别统计出其中英文字母、空格、数字和其它字符的个数。
java·开发语言
yzy851 小时前
数据同步工具 -- syncthing
开发语言
catchadmin1 小时前
PHP 应用 security.txt 漏洞披露实践
开发语言·php