使用python做了一个pdf转word的小工具

写在前面:近来工作上一直在处理word excel等文档的处理;于是利用新学的python写了一个小工具

1、其实实现起来很简单,主要是利用了pdf2docx这个库来实现

首先安装导入pdf2docx库

python 复制代码
pip install pdf2docx

2、代码部分:

话不多说直接上代码:

python 复制代码
import os
from pdf2docx import Converter
from loguru import logger
from tkinter import Tk, filedialog

# 获取到当前路径
path = os.getcwd()

# 打开文件选择对话框,选择要转换的PDF文件
def choose_pdf_file():
    root = Tk()
    root.withdraw()
    file_path = filedialog.askopenfilename(filetypes=[("PDF Files", "*.pdf")])
    root.destroy()
    return file_path

def main():
    # 选择要转换的PDF文件
    pdf_file = choose_pdf_file()

    if not pdf_file:
        logger.debug("未选择任何PDF文件。")
        return

    docx_file = os.path.splitext(pdf_file)[0] + ".docx"
    logger.debug("原始的PDF文件为-------%s" % pdf_file)

    cv = Converter(pdf_file)
    cv.convert(docx_file)
    logger.debug("转换之后的DOCX文件为-------%s" % docx_file)
    cv.close()

if __name__ == "__main__":
    main()
相关推荐
apocelipes5 小时前
常用编程语言和库的正则表达式性能对比
c语言·c++·python·性能优化·golang·开发工具和环境
用户8356290780517 小时前
使用 Python 在 PDF 中创建与管理书签
后端·python
MeixianAgent11 小时前
Python 回测数据入口怎么验?历史 K 线入库前先做 5 个检查
后端·python
咕白m62514 小时前
用 Python 实现一键批量查找与替换 Excel 数据
后端·python
SelectDB1 天前
Apache Doris Python UDF:让 SQL 直接调用 Python 生态,支撑 Agent 时代复杂业务逻辑
大数据·数据库·python
荣码2 天前
GraphRAG:普通RAG只能回答"点"的问题,我踩了4个坑才搞懂
java·python
金銀銅鐵2 天前
[Python] 基于欧几里得算法,实现分数约分计算器
python·数学
Lyn_Li2 天前
Kaggle Top 5 | 198只股票、200条数据的金融预测——BattleFin高分方案从零复现
python·kaggle·比赛复盘·金融预测
小九九的爸爸2 天前
前端想要入门Agent开发,要具备哪些Python基础?
python·agent·ai编程
阿耶同学2 天前
手把手教你用 LangGraph 搭建三层嵌套 Agent 架构
python·程序员