python将pdf转为docx

如何使用python实现将pdf文件转为docx文件

1.首先要安装pdf2docx库

python 复制代码
pip install pdf2docx

2.实现转换

python 复制代码
from pdf2docx import Converter


def convert_pdf_to_docx(input_pdf, output_docx):
    # 创建一个PDF转换器对象
    pdf_converter = Converter(input_pdf)

    # 将PDF转换为docx文件
    pdf_converter.convert(output_docx)

    # 关闭转换器以释放资源
    pdf_converter.close()


if __name__ == "__main__":
    input_pdf = "C:/Users/Windows/Desktop/test.pdf"  # 替换为自己实际的PDF文件路径
    output_docx = "C:/Users/Windows/Desktop/python.docx"  # 替换为自己实际的docx输出文件路径

    # 调用函数进行转换
    convert_pdf_to_docx(input_pdf, output_docx)
    print("PDF文件已成功转换为Word格式.")

执行成功:

之后就可以在自己输出路径下看到相应的docx文件了。

相关推荐
chao18984413 分钟前
基于C#实现Modbus通信及CRC校验
java·开发语言·c#
hxjhnct27 分钟前
JavaScript Promise 的常用API
开发语言·前端·javascript
xiaowu08038 分钟前
C# 嵌入资源加载 + 外部配置文件的兜底配置
开发语言·c#
毕设源码-邱学长39 分钟前
【开题答辩全过程】以 基于JSP论坛系统设计与实现为例,包含答辩的问题和答案
java·开发语言
Psycho_MrZhang1 小时前
高并发服务设计思路
python
FAFU_kyp1 小时前
Rust 语法速查
开发语言·后端·rust
sheji34161 小时前
【开题答辩全过程】以 基于JSP的汽车租赁管理系统为例,包含答辩的问题和答案
java·开发语言·汽车
liulilittle1 小时前
CLANG 交叉编译
linux·服务器·开发语言·前端·c++
多米Domi0111 小时前
0x3f 第21天 三更java进阶1-35 hot100普通数组
java·python·算法·leetcode·动态规划
沐知全栈开发2 小时前
Pandas 相关性分析
开发语言