python将pdf转为docx

如何使用python实现将pdf文件转为docx文件

1.首先要安装pdf2docx库

python 复制代码
pip install pdf2docx

2.实现转换

python 复制代码
from pdf2docx import Converter


def convert_pdf_to_docx(input_pdf, output_docx):
    # 创建一个PDF转换器对象
    pdf_converter = Converter(input_pdf)

    # 将PDF转换为docx文件
    pdf_converter.convert(output_docx)

    # 关闭转换器以释放资源
    pdf_converter.close()


if __name__ == "__main__":
    input_pdf = "C:/Users/Windows/Desktop/test.pdf"  # 替换为自己实际的PDF文件路径
    output_docx = "C:/Users/Windows/Desktop/python.docx"  # 替换为自己实际的docx输出文件路径

    # 调用函数进行转换
    convert_pdf_to_docx(input_pdf, output_docx)
    print("PDF文件已成功转换为Word格式.")

执行成功:

之后就可以在自己输出路径下看到相应的docx文件了。

相关推荐
AMoon丶5 分钟前
Golang--锁
linux·开发语言·数据结构·后端·算法·golang·mutex
白杆杆红伞伞14 分钟前
Qt进程间通信
开发语言·qt
艾莉丝努力练剑16 分钟前
确保多进程命名管道权限一致的方法
java·linux·运维·服务器·开发语言·网络·c++
漏刻有时16 分钟前
宝塔面板实现按年月自动备份目录至阿里云 OSS(python脚本、大文件分片上传版)
python·阿里云·云计算
用户03321266636718 分钟前
使用 Python 查找并替换 PDF 中的文本
python
2201_7562063421 分钟前
1111111
开发语言·python
一瓢西湖水23 分钟前
CPU使用超过阈值分析
java·开发语言·jvm
特种加菲猫24 分钟前
透过源码看本质:list 的模拟实现与核心原理
开发语言·c++
李日灐24 分钟前
改造红黑树实现封装 map/set:感受C++ 标准容器的精妙设计与底层实现
开发语言·数据结构·c++·后端·算法·红黑树
与虾牵手25 分钟前
Python asyncio 踩坑实录:5 个让我加班到凌晨的坑 🕳️
python