python将pdf转为docx

如何使用python实现将pdf文件转为docx文件

1.首先要安装pdf2docx库

python 复制代码
pip install pdf2docx

2.实现转换

python 复制代码
from pdf2docx import Converter


def convert_pdf_to_docx(input_pdf, output_docx):
    # 创建一个PDF转换器对象
    pdf_converter = Converter(input_pdf)

    # 将PDF转换为docx文件
    pdf_converter.convert(output_docx)

    # 关闭转换器以释放资源
    pdf_converter.close()


if __name__ == "__main__":
    input_pdf = "C:/Users/Windows/Desktop/test.pdf"  # 替换为自己实际的PDF文件路径
    output_docx = "C:/Users/Windows/Desktop/python.docx"  # 替换为自己实际的docx输出文件路径

    # 调用函数进行转换
    convert_pdf_to_docx(input_pdf, output_docx)
    print("PDF文件已成功转换为Word格式.")

执行成功:

之后就可以在自己输出路径下看到相应的docx文件了。

相关推荐
桀人23 分钟前
C++——模板初阶(收录在专栏C++入门到精通)
开发语言·c++
一直有一个ac的梦想31 分钟前
cmu15445 2025fall lec 18 transactions with two-phase lock
java·开发语言·数据库
毋语天1 小时前
FastAPI 进阶实战:请求体、文件上传、响应模型与数据校验
python·fastapi·api开发·数据校验·pydantic
JAVA社区1 小时前
Java进阶全套教程(四)—— SpringMVC框架详解
java·开发语言·spring·面试·职场和发展
Lumbrologist1 小时前
【C++】零基础入门 · 第 2 节:变量、基本数据类型与输入输出
java·开发语言·c++
码完就睡1 小时前
C语言——动态内存
c语言·开发语言
xyq20241 小时前
Java 数组
开发语言
雨辰AI1 小时前
人大金仓 V9 生产级专用监控大盘(含 120 + 指标 + 告警规则 + 一键导入)
java·开发语言·数据库·mysql·政务
时寒的笔记2 小时前
day13~14核心案例某采招网
开发语言·javascript·ecmascript
ZhengEnCi2 小时前
09a-斯坦福 CS336 作业一:BPE 分词器
python·神经网络