python将pdf转为docx

如何使用python实现将pdf文件转为docx文件

1.首先要安装pdf2docx库

python 复制代码
pip install pdf2docx

2.实现转换

python 复制代码
from pdf2docx import Converter


def convert_pdf_to_docx(input_pdf, output_docx):
    # 创建一个PDF转换器对象
    pdf_converter = Converter(input_pdf)

    # 将PDF转换为docx文件
    pdf_converter.convert(output_docx)

    # 关闭转换器以释放资源
    pdf_converter.close()


if __name__ == "__main__":
    input_pdf = "C:/Users/Windows/Desktop/test.pdf"  # 替换为自己实际的PDF文件路径
    output_docx = "C:/Users/Windows/Desktop/python.docx"  # 替换为自己实际的docx输出文件路径

    # 调用函数进行转换
    convert_pdf_to_docx(input_pdf, output_docx)
    print("PDF文件已成功转换为Word格式.")

执行成功:

之后就可以在自己输出路径下看到相应的docx文件了。

相关推荐
岱宗夫up20 小时前
【前端基础】HTML + CSS + JavaScript 进阶(一)
开发语言·前端·javascript·css·html
xyq202420 小时前
Shell echo命令详解
开发语言
不染尘.20 小时前
字符串哈希
开发语言·数据结构·c++·算法·哈希算法
Java.慈祥20 小时前
My First AI智能体!!!
人工智能·python·ai编程·智能体·coze·coze工作流·agent开发
qq_242188633220 小时前
【零基础使用Trae CN编写第一个AI游戏教程】
开发语言·前端·人工智能·python·游戏·html
小雨中_20 小时前
4.1 LLaMA 系列:从 LLaMA-1 到 LLaMA-3
人工智能·python·深度学习·机器学习·自然语言处理·llama
小鸡吃米…20 小时前
TensorFlow 模型导出
python·tensorflow·neo4j
无水先生21 小时前
python应用的参数管理(2):argparse 函数的用法
网络·数据库·python
belldeep21 小时前
python:pykalman 卡尔曼滤波, 与10日移动均线比较
python·pykalman·10日ma
浅念-21 小时前
C++ STL stack、queue 与容器适配器详解
开发语言·c++·经验分享·笔记·学习·面试