使用python做了一个pdf转word的小工具

写在前面:近来工作上一直在处理word excel等文档的处理;于是利用新学的python写了一个小工具

1、其实实现起来很简单,主要是利用了pdf2docx这个库来实现

首先安装导入pdf2docx库

python 复制代码
pip install pdf2docx

2、代码部分:

话不多说直接上代码:

python 复制代码
import os
from pdf2docx import Converter
from loguru import logger
from tkinter import Tk, filedialog

# 获取到当前路径
path = os.getcwd()

# 打开文件选择对话框,选择要转换的PDF文件
def choose_pdf_file():
    root = Tk()
    root.withdraw()
    file_path = filedialog.askopenfilename(filetypes=[("PDF Files", "*.pdf")])
    root.destroy()
    return file_path

def main():
    # 选择要转换的PDF文件
    pdf_file = choose_pdf_file()

    if not pdf_file:
        logger.debug("未选择任何PDF文件。")
        return

    docx_file = os.path.splitext(pdf_file)[0] + ".docx"
    logger.debug("原始的PDF文件为-------%s" % pdf_file)

    cv = Converter(pdf_file)
    cv.convert(docx_file)
    logger.debug("转换之后的DOCX文件为-------%s" % docx_file)
    cv.close()

if __name__ == "__main__":
    main()
相关推荐
Aerelin3 分钟前
爬虫playwright中的等待机制
前端·爬虫·python
卡比巴拉—林23 分钟前
Python print()函数详讲
开发语言·python
奶思图米球31 分钟前
Python多环境管理
开发语言·python
Aerelin35 分钟前
iframe讲解(爬虫playwright的特殊应用)
前端·爬虫·python·html
量化Mike1 小时前
【python报错】解决卸载Python时报错问题:No Python installation was detected
开发语言·python
2501_941798731 小时前
Python高性能网络爬虫实战:异步IO与多线程结合代码解析
开发语言·python
java1234_小锋1 小时前
基于Python深度学习的车辆车牌识别系统(PyTorch2卷积神经网络CNN+OpenCV4实现)视频教程 - 车牌矩阵定位
python·深度学习·cnn·车牌识别
linzeyang1 小时前
Advent of Code 2025 挑战全手写代码 Day 1 - 秘密入口
python·github
阿郎_20111 小时前
python自动化脚本-下载小说
python·selenium·网络爬虫
ERP老兵-冷溪虎山2 小时前
Python/JS/Go/Java同步学习(第五十篇半)四语言“path路径详解“对照表: 看完这篇定位文件就通透了(附源码/截图/参数表/避坑指南)
java·javascript·python·golang·中医编程·编程四语言同步学·path路径详解