python将pdf转为docx

如何使用python实现将pdf文件转为docx文件

1.首先要安装pdf2docx库

python 复制代码
pip install pdf2docx

2.实现转换

python 复制代码
from pdf2docx import Converter


def convert_pdf_to_docx(input_pdf, output_docx):
    # 创建一个PDF转换器对象
    pdf_converter = Converter(input_pdf)

    # 将PDF转换为docx文件
    pdf_converter.convert(output_docx)

    # 关闭转换器以释放资源
    pdf_converter.close()


if __name__ == "__main__":
    input_pdf = "C:/Users/Windows/Desktop/test.pdf"  # 替换为自己实际的PDF文件路径
    output_docx = "C:/Users/Windows/Desktop/python.docx"  # 替换为自己实际的docx输出文件路径

    # 调用函数进行转换
    convert_pdf_to_docx(input_pdf, output_docx)
    print("PDF文件已成功转换为Word格式.")

执行成功:

之后就可以在自己输出路径下看到相应的docx文件了。

相关推荐
itzixiao2 分钟前
L1-049 天梯赛座位分配(20 分)[java][python][c]
java·开发语言·python
m0_746752303 分钟前
HTML5视频标签针对不同设备DPR的资源选择逻辑
jvm·数据库·python
2301_773553623 分钟前
c++怎么在Linux下获取文件被最后一次访问的精确纳秒时间【进阶】
jvm·数据库·python
gmaajt7 分钟前
CSS如何给按钮添加按下缩小的动画_利用-active配合transform
jvm·数据库·python
子非鱼@Itfuture12 分钟前
ThreadLocal 是什么?如何用?以及最佳使用场景
java·开发语言·spring
杨凯凡13 分钟前
【024】JVM 参数入门:堆、栈、元空间与典型模板
java·开发语言·jvm
m0_7478545215 分钟前
CSS如何让响应式图片在容器内居中_利用background-position
jvm·数据库·python
不懒不懒15 分钟前
【PaddleOCR实战指南:图像文字识别、实时摄像头与PyQt5 GUI开发】
开发语言·python
han_hanker18 分钟前
下拉模糊搜索多选, 编辑,详情问题
开发语言·javascript·ecmascript
2401_8716965223 分钟前
CSS如何优化移动端CSS选择器性能_遵循BEM规范避免过长嵌套
jvm·数据库·python