PDF 转 word (优化版)

PDF 转 word (优化版)

原文链接:url针对原文做了一些优化,适配性更好

首先在pdf所在文件夹中创建pdf2word.py

python 复制代码
import  os
from pdf2docx import Converter

def pdf_docx():
    # 获取当前路径
    file_path = os.getcwd()
	
    # 获取路径中的每个文件
    for file in os.listdir(file_path):
        #获取后缀名
        suff_name = os.path.splitext(file)[1]
		
		#大小写判断后缀,因为wps的pdf是大写,所以容易被忽略
        if suff_name != '.PDF' and suff_name != '.pdf':
            continue
		
        # 转换
        file_name = os.path.splitext(file)[0]
        pdf_name = os.path.join(os.getcwd(), file)
        docx_name = os.path.join(os.getcwd(), file_name + '.docx')
        cv = Converter(pdf_name)
        cv.convert(docx_name)
        cv.close()
if __name__ == '__main__':
    pdf_docx()

pyintaller打包后使用效果更佳

pyinstaller -F pdf2word.py转换后,在该文件夹路径中找到dist文件夹,里面的.exe后缀文件就是打包好的执行程序,只需要将其与需要转换的pdf文件放在同一路径下,点击程序就能直接遍历pdf并转换

详细参考原文链接

相关推荐
喵手1 分钟前
Python爬虫实战:硬核解析 Google Chrome 官方更新日志(正则+文本清洗篇)(附 CSV 导出)!
爬虫·python·爬虫实战·零基础python爬虫教学·csv导出·监控谷歌版本发布历史·获取稳定版更新日志
小邓睡不饱耶3 分钟前
实战|W餐饮平台智能化菜品推荐方案(含Spark实操+算法选型+完整流程)
python·ai·ai编程·ai写作
草莓熊Lotso5 分钟前
Qt 主窗口核心组件实战:菜单栏、工具栏、状态栏、浮动窗口全攻略
运维·开发语言·人工智能·python·qt·ui
aiguangyuan10 分钟前
基于BiLSTM-CRF的命名实体识别模型:原理剖析与实现详解
人工智能·python·nlp
禹凕14 分钟前
Python编程——进阶知识(MYSQL引导入门)
开发语言·python·mysql
阿钱真强道16 分钟前
13 JetLinks MQTT:网关设备与网关子设备 - 温控设备场景
python·网络协议·harmonyos
我的xiaodoujiao19 分钟前
使用 Python 语言 从 0 到 1 搭建完整 Web UI自动化测试学习系列 47--设置Selenium以无头模式运行代码
python·学习·selenium·测试工具·pytest
寻星探路6 小时前
【深度长文】万字攻克网络原理:从 HTTP 报文解构到 HTTPS 终极加密逻辑
java·开发语言·网络·python·http·ai·https
ValhallaCoder9 小时前
hot100-二叉树I
数据结构·python·算法·二叉树
猫头虎9 小时前
如何排查并解决项目启动时报错Error encountered while processing: java.io.IOException: closed 的问题
java·开发语言·jvm·spring boot·python·开源·maven