PDF 转 word (优化版)

PDF 转 word (优化版)

原文链接:url针对原文做了一些优化,适配性更好

首先在pdf所在文件夹中创建pdf2word.py

python 复制代码
import  os
from pdf2docx import Converter

def pdf_docx():
    # 获取当前路径
    file_path = os.getcwd()
	
    # 获取路径中的每个文件
    for file in os.listdir(file_path):
        #获取后缀名
        suff_name = os.path.splitext(file)[1]
		
		#大小写判断后缀,因为wps的pdf是大写,所以容易被忽略
        if suff_name != '.PDF' and suff_name != '.pdf':
            continue
		
        # 转换
        file_name = os.path.splitext(file)[0]
        pdf_name = os.path.join(os.getcwd(), file)
        docx_name = os.path.join(os.getcwd(), file_name + '.docx')
        cv = Converter(pdf_name)
        cv.convert(docx_name)
        cv.close()
if __name__ == '__main__':
    pdf_docx()

pyintaller打包后使用效果更佳

pyinstaller -F pdf2word.py转换后,在该文件夹路径中找到dist文件夹,里面的.exe后缀文件就是打包好的执行程序,只需要将其与需要转换的pdf文件放在同一路径下,点击程序就能直接遍历pdf并转换

详细参考原文链接

相关推荐
2401_889884668 分钟前
使用Pandas进行数据分析:从数据清洗到可视化
jvm·数据库·python
研究点啥好呢9 分钟前
3月15日GitHub热门项目推荐 | 从本地部署到生产实践
人工智能·python·github·cursor·vibe coding
no_work10 分钟前
卷积神经网络cnn图像识别项目合集
人工智能·python·深度学习·神经网络·机器学习·cnn
程序媛徐师姐15 分钟前
Python基于Django的网络漏洞扫描工具的开发与优化【附源码、文档说明】
python·django·漏洞扫描工具·漏洞扫描·网络漏洞扫描工具·python网络漏洞扫描工具·pytho网络漏洞扫描
zzb158016 分钟前
Agent学习-ReAct框架
java·人工智能·python·机器学习·ai
Dxy123931021617 分钟前
PyTorch的OneCycleLR详细介绍:解锁“超级收敛”的油门控制术
人工智能·pytorch·python
橘bird21 分钟前
LangChain1.2 学习笔记(自用)(未完结)
笔记·python·学习·langchain
四代机您发多少22 分钟前
从零开始训练一个大模型
人工智能·pytorch·python·transformer
秦牛正威22 分钟前
MacOS:Python `command not found` 问题修复记录
python
SmartBrain23 分钟前
基于SpringAI架构的多智能体协作(进阶版)
人工智能·spring boot·python·spring cloud