使用开源项目:pdf2docx,让PDF转换为Word

目录

1.安装python

[2.安装 pdf2docx](#2.安装 pdf2docx)

[3.使用 pdf2docx 转换 PDF 到 Word](#3.使用 pdf2docx 转换 PDF 到 Word)


pdf2docx:GitCode - 全球开发者的开源社区,开源代码托管平台

环境:windows电脑

1.安装python

Download Python | Python.org

最好下载3.8以上的版本

安装时记得选择上:Add ... Path

安装时默认会装pip等工具,因此下载安装包时不要选择:embeddable package (64-bit)

2.安装 pdf2docx

命令:pip install pdf2docx --timeout 100

3.使用 pdf2docx 转换 PDF 到 Word

python 复制代码
from pdf2docx import Converter

# 输入PDF文件路径
pdf_file = "D:/software/python3.12/code/redis.pdf"

# 输出Word文档路径
docx_file = "D:/software/python3.12/code/redis.docx"

# 创建转换器
cv = Converter(pdf_file)

# 执行转换
cv.convert(docx_file, start=0, end=None)
cv.close()

运行: python .\pdfToword.py

查看转换后的Word文档

相关推荐
一个懒鬼2 小时前
Edge浏览器打开PDF文件显示空白(每次需要等上一会)
windows·pdf
Lauren_Lu11 小时前
pdf 不是扫描件,但却无法搜索关键词【问题尝试解决未果记录】
pdf
Python猫21 小时前
付费专栏·Python潮流周刊电子书合集(epub、pdf、markdown)下载
python·计算机·pdf·电子书·资料
JackieZhengChina1 天前
用python清除PDF文件中的水印(Adobe Acrobat 无法删除)
pdf
geovindu1 天前
vue3: pdf.js 3.4.120 using javascript
开发语言·javascript·vue.js·pdf
TextIn智能文档云平台2 天前
PDF文档解析新突破:图表识别、公式还原、手写字体处理,让AI真正读懂复杂文档!
图像处理·人工智能·算法·自然语言处理·pdf·ocr
old_power2 天前
【Python】PDF文件处理(PyPDF2、borb、fitz)
python·pdf
belldeep2 天前
vite:npm 安装 pdfjs-dist , PDF.js View 预览功能示例
javascript·pdf·pdfjs-dist·pdf.worker
dtzly2 天前
若依定制pdf生成实战
pdf
令狐少侠20112 天前
ai之pdf解析rapidOCR 的两种底层依赖PaddlePaddle 和ONNXRuntime
人工智能·ai·pdf