PDF 转 word (优化版)

PDF 转 word (优化版)

原文链接:url针对原文做了一些优化,适配性更好

首先在pdf所在文件夹中创建pdf2word.py

python 复制代码
import  os
from pdf2docx import Converter

def pdf_docx():
    # 获取当前路径
    file_path = os.getcwd()
	
    # 获取路径中的每个文件
    for file in os.listdir(file_path):
        #获取后缀名
        suff_name = os.path.splitext(file)[1]
		
		#大小写判断后缀,因为wps的pdf是大写,所以容易被忽略
        if suff_name != '.PDF' and suff_name != '.pdf':
            continue
		
        # 转换
        file_name = os.path.splitext(file)[0]
        pdf_name = os.path.join(os.getcwd(), file)
        docx_name = os.path.join(os.getcwd(), file_name + '.docx')
        cv = Converter(pdf_name)
        cv.convert(docx_name)
        cv.close()
if __name__ == '__main__':
    pdf_docx()

pyintaller打包后使用效果更佳

pyinstaller -F pdf2word.py转换后,在该文件夹路径中找到dist文件夹,里面的.exe后缀文件就是打包好的执行程序,只需要将其与需要转换的pdf文件放在同一路径下,点击程序就能直接遍历pdf并转换

详细参考原文链接

相关推荐
lixin5565562 分钟前
基于迁移学习的图像风格增强器
java·人工智能·pytorch·python·深度学习·语言模型
阡陌..8 分钟前
浅谈SAR图像处理---形态学滤波
图像处理·人工智能·python
qq_229058011 小时前
python-Dgango项目收集静态文件、构建前端、安装依赖
开发语言·python
测试人社区—66791 小时前
2025区块链分层防御指南:AI驱动的安全测试实战策略
开发语言·驱动开发·python·appium·pytest
喵手1 小时前
Python爬虫零基础入门【第九章:实战项目教学·第10节】下载型资源采集:PDF/附件下载 + 去重校验!
爬虫·python·爬虫实战·python爬虫工程化实战·零基础python爬虫教学·下载型资源采集·pdf下载
玄同7651 小时前
深入理解 SQLAlchemy 的 relationship:让 ORM 关联像 Python 对象一样简单
人工智能·python·sql·conda·fastapi·pip·sqlalchemy
Yorlen_Zhang1 小时前
Python @property 装饰器详解:优雅控制属性访问的魔法
开发语言·python
喵手2 小时前
Python爬虫零基础入门【第九章:实战项目教学·第13节】)动态站点“回到接口“:识别接口并用 Requests 重写(更稳)!
爬虫·python·python爬虫实战·python爬虫工程化实战·python爬虫零基础入门·动态站点·识别接口并requests重写
幸福的达哥2 小时前
Python多线程、多进程、协程、锁、同步、异步的详解和应用
开发语言·python
m0_706653232 小时前
Python生成器(Generator)与Yield关键字:惰性求值之美
jvm·数据库·python