python将pdf转为docx

如何使用python实现将pdf文件转为docx文件

1.首先要安装pdf2docx库

python 复制代码
pip install pdf2docx

2.实现转换

python 复制代码
from pdf2docx import Converter


def convert_pdf_to_docx(input_pdf, output_docx):
    # 创建一个PDF转换器对象
    pdf_converter = Converter(input_pdf)

    # 将PDF转换为docx文件
    pdf_converter.convert(output_docx)

    # 关闭转换器以释放资源
    pdf_converter.close()


if __name__ == "__main__":
    input_pdf = "C:/Users/Windows/Desktop/test.pdf"  # 替换为自己实际的PDF文件路径
    output_docx = "C:/Users/Windows/Desktop/python.docx"  # 替换为自己实际的docx输出文件路径

    # 调用函数进行转换
    convert_pdf_to_docx(input_pdf, output_docx)
    print("PDF文件已成功转换为Word格式.")

执行成功:

之后就可以在自己输出路径下看到相应的docx文件了。

相关推荐
爱笑的眼睛111 天前
深入理解MongoDB PyMongo API:从基础到高级实战
java·人工智能·python·ai
辣椒酱.1 天前
jupyter相关
python·jupyter
笃行客从不躺平1 天前
遇到大SQL怎么处理
java·开发语言·数据库·sql
郝学胜-神的一滴1 天前
Python中常见的内置类型
开发语言·python·程序人生·个人开发
g***B7381 天前
Kotlin协程在Android中的使用
android·开发语言·kotlin
火白学安全1 天前
《Python红队攻防零基础脚本编写:进阶篇(一)》
开发语言·python·安全·web安全·网络安全·系统安全
爱码小白1 天前
PyQt5 QTimer总结
开发语言·qt
A***27951 天前
Kotlin反射机制
android·开发语言·kotlin
FreeCode1 天前
LangGraph1.0智能体开发:运行时系统
python·langchain·agent
E***q5391 天前
C++内存对齐优化
开发语言·c++