python将pdf转为docx

如何使用python实现将pdf文件转为docx文件

1.首先要安装pdf2docx库

python 复制代码
pip install pdf2docx

2.实现转换

python 复制代码
from pdf2docx import Converter


def convert_pdf_to_docx(input_pdf, output_docx):
    # 创建一个PDF转换器对象
    pdf_converter = Converter(input_pdf)

    # 将PDF转换为docx文件
    pdf_converter.convert(output_docx)

    # 关闭转换器以释放资源
    pdf_converter.close()


if __name__ == "__main__":
    input_pdf = "C:/Users/Windows/Desktop/test.pdf"  # 替换为自己实际的PDF文件路径
    output_docx = "C:/Users/Windows/Desktop/python.docx"  # 替换为自己实际的docx输出文件路径

    # 调用函数进行转换
    convert_pdf_to_docx(input_pdf, output_docx)
    print("PDF文件已成功转换为Word格式.")

执行成功:

之后就可以在自己输出路径下看到相应的docx文件了。

相关推荐
lucky九年3 分钟前
GO语言模拟C++封装,继承,多态
开发语言·c++·golang
温天仁7 分钟前
西门子PLC编程实践教程:工控工程案例学习
开发语言·学习·自动化·php
小陈工9 分钟前
Python Web开发入门(十):数据库迁移与版本管理——让数据库变更可控可回滚
前端·数据库·人工智能·python·sql·云原生·架构
lsx2024069 分钟前
Java 数组
开发语言
JosieBook13 分钟前
【C#】VS中的 跨线程调试异常:CrossThreadMessagingException
开发语言·c#
爱滑雪的码农15 分钟前
Java八:Character 类与string类
java·开发语言
csbysj202016 分钟前
《C 标准库 - 参考手册》
开发语言
JoshRen19 分钟前
Python中的简单爬虫
爬虫·python·信息可视化
永远的超音速22 分钟前
PyCharm性能调优避坑录大纲
python·pycharm
AnchorYYC30 分钟前
TEI Inference Toolkit - 工业级Embedding/NLI /Reranking服务调用最佳实践
人工智能·python·持续部署·#大模型应用