python将pdf转为docx

如何使用python实现将pdf文件转为docx文件

1.首先要安装pdf2docx库

python 复制代码
pip install pdf2docx

2.实现转换

python 复制代码
from pdf2docx import Converter


def convert_pdf_to_docx(input_pdf, output_docx):
    # 创建一个PDF转换器对象
    pdf_converter = Converter(input_pdf)

    # 将PDF转换为docx文件
    pdf_converter.convert(output_docx)

    # 关闭转换器以释放资源
    pdf_converter.close()


if __name__ == "__main__":
    input_pdf = "C:/Users/Windows/Desktop/test.pdf"  # 替换为自己实际的PDF文件路径
    output_docx = "C:/Users/Windows/Desktop/python.docx"  # 替换为自己实际的docx输出文件路径

    # 调用函数进行转换
    convert_pdf_to_docx(input_pdf, output_docx)
    print("PDF文件已成功转换为Word格式.")

执行成功:

之后就可以在自己输出路径下看到相应的docx文件了。

相关推荐
AI玫瑰助手6 分钟前
Python运算符:成员运算符(in/not in)的使用场景
开发语言·python·信息可视化
Warson_L30 分钟前
python - class 入门
python
AI人工智能+电脑小能手33 分钟前
【大白话说Java面试题 第77题】【Mysql篇】第7题:回表查询与全表扫描的区别?
java·开发语言·数据库·mysql·面试
水木流年追梦36 分钟前
大模型入门-大模型分布式训练2
开发语言·分布式·python·算法·正则表达式·prompt
ZHANG8023ZHEN1 小时前
Diffusion 数学推理
人工智能·python·机器学习
海天一色y1 小时前
SGLang 本地部署 Qwen3-8B 大模型实战指南
python·sglang
口袋里のInit1 小时前
基础知识——ARM M核入栈出栈流程
开发语言·arm开发
代码帮1 小时前
面试题 - GIL全局解释器锁 :为什么Python多线程不能利用多核?GIL对I/O密集和CPU密集任务的影响?如何绕过GIL(多进程、C扩展)
python·面试
罗超驿1 小时前
5.Java线程创建全攻略:5种写法 + 高频面试题解析
java·开发语言·java-ee
徐安安ye2 小时前
FlashAttention流式输出:Streaming Chunked Attention与增量解码
人工智能·pytorch·python