使用开源项目:pdf2docx,让PDF转换为Word

目录

1.安装python

[2.安装 pdf2docx](#2.安装 pdf2docx)

[3.使用 pdf2docx 转换 PDF 到 Word](#3.使用 pdf2docx 转换 PDF 到 Word)


pdf2docx:GitCode - 全球开发者的开源社区,开源代码托管平台

环境:windows电脑

1.安装python

Download Python | Python.org

最好下载3.8以上的版本

安装时记得选择上:Add ... Path

安装时默认会装pip等工具,因此下载安装包时不要选择:embeddable package (64-bit)

2.安装 pdf2docx

命令:pip install pdf2docx --timeout 100

3.使用 pdf2docx 转换 PDF 到 Word

python 复制代码
from pdf2docx import Converter

# 输入PDF文件路径
pdf_file = "D:/software/python3.12/code/redis.pdf"

# 输出Word文档路径
docx_file = "D:/software/python3.12/code/redis.docx"

# 创建转换器
cv = Converter(pdf_file)

# 执行转换
cv.convert(docx_file, start=0, end=None)
cv.close()

运行: python .\pdfToword.py

查看转换后的Word文档

相关推荐
开开心心_Every1 天前
免费进销存管理软件:云端本地双部署
java·游戏·微信·eclipse·pdf·excel·语音识别
winfredzhang2 天前
从零构建:手写一个支持“高度定制化排版”的 Chrome 网页摘录插件
chrome·pdf·插件·epub·零碎信息归档
裴嘉靖2 天前
前端获取二进制文件并预览的完整指南
前端·pdf
KG_LLM图谱增强大模型2 天前
[20页中英文PDF]生物制药企业新一代知识管理:用知识图谱+大模型构建“第二大脑“
人工智能·pdf·知识图谱
开开心心就好2 天前
系统清理工具清理缓存日志,启动卸载管理
linux·运维·服务器·神经网络·cnn·pdf·1024程序员节
helloworld也报错?2 天前
保存网页为PDF
前端·javascript·pdf
东方-教育技术博主2 天前
PDF文件夹去重
pdf
eybk2 天前
拖放pdf转化为txt文件多进程多线程合并分词版
java·python·pdf
梦凡尘2 天前
前端web端解析 Word、Pdf 文档文本内容
pdf·js
白典典2 天前
iTextPDF生成手册时目录页码与实际页码不匹配问题求助
java·spring·pdf·intellij-idea