PDF 转 word (优化版)

PDF 转 word (优化版)

原文链接:url针对原文做了一些优化,适配性更好

首先在pdf所在文件夹中创建pdf2word.py

python 复制代码
import  os
from pdf2docx import Converter

def pdf_docx():
    # 获取当前路径
    file_path = os.getcwd()
	
    # 获取路径中的每个文件
    for file in os.listdir(file_path):
        #获取后缀名
        suff_name = os.path.splitext(file)[1]
		
		#大小写判断后缀,因为wps的pdf是大写,所以容易被忽略
        if suff_name != '.PDF' and suff_name != '.pdf':
            continue
		
        # 转换
        file_name = os.path.splitext(file)[0]
        pdf_name = os.path.join(os.getcwd(), file)
        docx_name = os.path.join(os.getcwd(), file_name + '.docx')
        cv = Converter(pdf_name)
        cv.convert(docx_name)
        cv.close()
if __name__ == '__main__':
    pdf_docx()

pyintaller打包后使用效果更佳

pyinstaller -F pdf2word.py转换后,在该文件夹路径中找到dist文件夹,里面的.exe后缀文件就是打包好的执行程序,只需要将其与需要转换的pdf文件放在同一路径下,点击程序就能直接遍历pdf并转换

详细参考原文链接

相关推荐
彦为君2 小时前
Agent 安全:从权限提示到沙箱隔离
python·ai·ai编程
PILIPALAPENG3 小时前
Python 语法速成指南:前端开发者视角(JS 类比版)
前端·人工智能·python
用户8356290780514 小时前
Python 操作 PowerPoint 页眉与页脚指南
后端·python
枫叶林FYL4 小时前
项目九:异步高性能爬虫与数据采集中枢 —— 基于 Crawl<sub>4</sub>AI 与 Playwright 的现代化数据采集平台 项目总览
爬虫·python·深度学习·wpf
猫猫的小茶馆5 小时前
【Python】函数与模块化编程
linux·开发语言·arm开发·驱动开发·python·stm32
驯龙高手_追风5 小时前
Adobe Acrobat PDF阅读器设置默认滚动翻页
adobe·pdf·adobe acrobat reader·adobe reader
Miss_min5 小时前
128K长序列数据生成
开发语言·python·深度学习
love530love5 小时前
MingLi-Bench 项目部署实录:基于 EPGF 架构的工程化实践
人工智能·windows·python·架构·aigc·epgf·mingli-bench
猿儿本无心6 小时前
快速搭建Python项目(Vscode+uv+FastAPI)
vscode·python·uv