python将pdf转为docx

如何使用python实现将pdf文件转为docx文件

1.首先要安装pdf2docx库

python 复制代码
pip install pdf2docx

2.实现转换

python 复制代码
from pdf2docx import Converter


def convert_pdf_to_docx(input_pdf, output_docx):
    # 创建一个PDF转换器对象
    pdf_converter = Converter(input_pdf)

    # 将PDF转换为docx文件
    pdf_converter.convert(output_docx)

    # 关闭转换器以释放资源
    pdf_converter.close()


if __name__ == "__main__":
    input_pdf = "C:/Users/Windows/Desktop/test.pdf"  # 替换为自己实际的PDF文件路径
    output_docx = "C:/Users/Windows/Desktop/python.docx"  # 替换为自己实际的docx输出文件路径

    # 调用函数进行转换
    convert_pdf_to_docx(input_pdf, output_docx)
    print("PDF文件已成功转换为Word格式.")

执行成功:

之后就可以在自己输出路径下看到相应的docx文件了。

相关推荐
jwn9996 小时前
Laravel11.x新特性全解析
android·开发语言·php·laravel
feifeigo1236 小时前
航天器交会的分布式模型预测控制(DMPC)MATLAB实现
开发语言·分布式·matlab
于先生吖6 小时前
支持二开与商用,JAVA 漫剧付费观看系统完整源码
java·开发语言
环黄金线HHJX.6 小时前
【从0到1】
开发语言·人工智能·算法·交互
曹牧6 小时前
Java: 从oracle表中获取一组kv序列
java·开发语言·oracle
深邃-6 小时前
【C语言】-数据在内存中的存储(1)
c语言·开发语言·数据结构·c++·算法
Lyyaoo.6 小时前
【Java基础面经】Java 注解的底层原理
java·开发语言·python
HAPPY酷6 小时前
PyCharm 终极避坑指南:环境选择、镜像加速与包管理
ide·python·pycharm
妙蛙种子3116 小时前
【Java设计模式 | 创建者模式】 抽象工厂模式
java·开发语言·后端·设计模式·抽象工厂模式
如竟没有火炬6 小时前
搜索二维矩阵
数据结构·python·算法·leetcode·矩阵