使用开源项目:pdf2docx,让PDF转换为Word

目录

1.安装python

[2.安装 pdf2docx](#2.安装 pdf2docx)

[3.使用 pdf2docx 转换 PDF 到 Word](#3.使用 pdf2docx 转换 PDF 到 Word)


pdf2docx:GitCode - 全球开发者的开源社区,开源代码托管平台

环境:windows电脑

1.安装python

Download Python | Python.org

最好下载3.8以上的版本

安装时记得选择上:Add ... Path

安装时默认会装pip等工具,因此下载安装包时不要选择:embeddable package (64-bit)

2.安装 pdf2docx

命令:pip install pdf2docx --timeout 100

3.使用 pdf2docx 转换 PDF 到 Word

python 复制代码
from pdf2docx import Converter

# 输入PDF文件路径
pdf_file = "D:/software/python3.12/code/redis.pdf"

# 输出Word文档路径
docx_file = "D:/software/python3.12/code/redis.docx"

# 创建转换器
cv = Converter(pdf_file)

# 执行转换
cv.convert(docx_file, start=0, end=None)
cv.close()

运行: python .\pdfToword.py

查看转换后的Word文档

相关推荐
weixin_3975740916 天前
PDF复杂表格的1:1还原引擎:跨页表格自动拼接技术实战
大数据·人工智能·pdf
Metaphor69216 天前
使用 Python 将 PDF 转换为 HTML
python·pdf·html
2601_9618451516 天前
粉笔行测5000题电子版|pdf|解析
pdf·新媒体运营·github·个人开发·内容运营·规格说明书·极限编程
Sour16 天前
PDF翻译卡住不动怎么办?扫描件、OCR 和大文件排查清单
前端·pdf·ocr
狂奔solar16 天前
OpenDataLoader-PDF 做 PDF 解析可视化调试器
pdf·rag 预处理
chatexcel16 天前
ChatExcel Max使用教程:图片、PDF、网页与复杂Excel的一站式数据分析
数据分析·pdf·excel
绘梨衣54716 天前
PDF表格解析知识总结
开发语言·python·pdf
qq_5469372716 天前
Excel批量转PDF_Word_图片,支持自动合并报表,效率翻倍。
pdf·word·excel
zyplayer-doc17 天前
企业知识库安全与权限管理完全指南:从加密到审计的六层防护
人工智能·安全·pdf·编辑器·创业创新
易鹤鹤.17 天前
pdf标注高亮
pdf