PDF 转 word (优化版)

PDF 转 word (优化版)

原文链接:url针对原文做了一些优化,适配性更好

首先在pdf所在文件夹中创建pdf2word.py

python 复制代码
import  os
from pdf2docx import Converter

def pdf_docx():
    # 获取当前路径
    file_path = os.getcwd()
	
    # 获取路径中的每个文件
    for file in os.listdir(file_path):
        #获取后缀名
        suff_name = os.path.splitext(file)[1]
		
		#大小写判断后缀,因为wps的pdf是大写,所以容易被忽略
        if suff_name != '.PDF' and suff_name != '.pdf':
            continue
		
        # 转换
        file_name = os.path.splitext(file)[0]
        pdf_name = os.path.join(os.getcwd(), file)
        docx_name = os.path.join(os.getcwd(), file_name + '.docx')
        cv = Converter(pdf_name)
        cv.convert(docx_name)
        cv.close()
if __name__ == '__main__':
    pdf_docx()

pyintaller打包后使用效果更佳

pyinstaller -F pdf2word.py转换后,在该文件夹路径中找到dist文件夹,里面的.exe后缀文件就是打包好的执行程序,只需要将其与需要转换的pdf文件放在同一路径下,点击程序就能直接遍历pdf并转换

详细参考原文链接

相关推荐
前端付豪15 小时前
LangChain链 写一篇完美推文?用SequencialChain链接不同的组件
人工智能·python·langchain
曲幽15 小时前
FastAPI实战:打造本地文生图接口,ollama+diffusers让AI绘画更听话
python·fastapi·web·cors·diffusers·lcm·ollama·dreamshaper8·txt2img
老赵全栈实战15 小时前
Pydantic配置管理最佳实践(一)
python
阿尔的代码屋21 小时前
[大模型实战 07] 基于 LlamaIndex ReAct 框架手搓全自动博客监控 Agent
人工智能·python
AI探索者2 天前
LangGraph StateGraph 实战:状态机聊天机器人构建指南
python
AI探索者2 天前
LangGraph 入门:构建带记忆功能的天气查询 Agent
python
FishCoderh2 天前
Python自动化办公实战:批量重命名文件,告别手动操作
python
躺平大鹅2 天前
Python函数入门详解(定义+调用+参数)
python
曲幽2 天前
我用FastAPI接ollama大模型,差点被asyncio整崩溃(附对话窗口实战)
python·fastapi·web·async·httpx·asyncio·ollama
两万五千个小时2 天前
落地实现 Anthropic Multi-Agent Research System
人工智能·python·架构