使用python做了一个pdf转word的小工具

写在前面:近来工作上一直在处理word excel等文档的处理;于是利用新学的python写了一个小工具

1、其实实现起来很简单,主要是利用了pdf2docx这个库来实现

首先安装导入pdf2docx库

python 复制代码
pip install pdf2docx

2、代码部分:

话不多说直接上代码:

python 复制代码
import os
from pdf2docx import Converter
from loguru import logger
from tkinter import Tk, filedialog

# 获取到当前路径
path = os.getcwd()

# 打开文件选择对话框,选择要转换的PDF文件
def choose_pdf_file():
    root = Tk()
    root.withdraw()
    file_path = filedialog.askopenfilename(filetypes=[("PDF Files", "*.pdf")])
    root.destroy()
    return file_path

def main():
    # 选择要转换的PDF文件
    pdf_file = choose_pdf_file()

    if not pdf_file:
        logger.debug("未选择任何PDF文件。")
        return

    docx_file = os.path.splitext(pdf_file)[0] + ".docx"
    logger.debug("原始的PDF文件为-------%s" % pdf_file)

    cv = Converter(pdf_file)
    cv.convert(docx_file)
    logger.debug("转换之后的DOCX文件为-------%s" % docx_file)
    cv.close()

if __name__ == "__main__":
    main()
相关推荐
彦为君3 小时前
Agent 安全:从权限提示到沙箱隔离
python·ai·ai编程
PILIPALAPENG3 小时前
Python 语法速成指南:前端开发者视角(JS 类比版)
前端·人工智能·python
用户8356290780514 小时前
Python 操作 PowerPoint 页眉与页脚指南
后端·python
枫叶林FYL5 小时前
项目九:异步高性能爬虫与数据采集中枢 —— 基于 Crawl<sub>4</sub>AI 与 Playwright 的现代化数据采集平台 项目总览
爬虫·python·深度学习·wpf
猫猫的小茶馆5 小时前
【Python】函数与模块化编程
linux·开发语言·arm开发·驱动开发·python·stm32
驯龙高手_追风6 小时前
Adobe Acrobat PDF阅读器设置默认滚动翻页
adobe·pdf·adobe acrobat reader·adobe reader
Miss_min6 小时前
128K长序列数据生成
开发语言·python·深度学习
love530love6 小时前
MingLi-Bench 项目部署实录:基于 EPGF 架构的工程化实践
人工智能·windows·python·架构·aigc·epgf·mingli-bench
猿儿本无心6 小时前
快速搭建Python项目(Vscode+uv+FastAPI)
vscode·python·uv