使用python做了一个pdf转word的小工具

写在前面:近来工作上一直在处理word excel等文档的处理;于是利用新学的python写了一个小工具

1、其实实现起来很简单,主要是利用了pdf2docx这个库来实现

首先安装导入pdf2docx库

python 复制代码
pip install pdf2docx

2、代码部分:

话不多说直接上代码:

python 复制代码
import os
from pdf2docx import Converter
from loguru import logger
from tkinter import Tk, filedialog

# 获取到当前路径
path = os.getcwd()

# 打开文件选择对话框,选择要转换的PDF文件
def choose_pdf_file():
    root = Tk()
    root.withdraw()
    file_path = filedialog.askopenfilename(filetypes=[("PDF Files", "*.pdf")])
    root.destroy()
    return file_path

def main():
    # 选择要转换的PDF文件
    pdf_file = choose_pdf_file()

    if not pdf_file:
        logger.debug("未选择任何PDF文件。")
        return

    docx_file = os.path.splitext(pdf_file)[0] + ".docx"
    logger.debug("原始的PDF文件为-------%s" % pdf_file)

    cv = Converter(pdf_file)
    cv.convert(docx_file)
    logger.debug("转换之后的DOCX文件为-------%s" % docx_file)
    cv.close()

if __name__ == "__main__":
    main()
相关推荐
lang2015092819 分钟前
Java WebSocket API:JSR-356详解
java·python·websocket
jiang_changsheng22 分钟前
环境管理工具全景图与深度对比
java·c语言·开发语言·c++·python·r语言
linjoe9931 分钟前
【Medical AI\pathology】WSI 的 JPEG 压缩质量与存储效率权衡分析
python·图像压缩·计算病理学·wsi
Fightting8836 分钟前
Tkinter Button bind hover message
开发语言·python
玄同7651 小时前
LangChain 1.0 模型接口:多厂商集成与统一调用
开发语言·人工智能·python·langchain·知识图谱·rag·智能体
喵手1 小时前
Python爬虫实战:构建招聘会数据采集系统 - requests+lxml 实战企业名单爬取与智能分析!
爬虫·python·爬虫实战·requests·lxml·零基础python爬虫教学·招聘会数据采集
专注VB编程开发20年2 小时前
python图片验证码识别selenium爬虫--超级鹰实现自动登录,滑块,点击
数据库·python·mysql
iFeng的小屋2 小时前
【2026最新当当网爬虫分享】用Python爬取千本日本相关图书,自动分析价格分布!
开发语言·爬虫·python
民乐团扒谱机2 小时前
【微科普】3D 演奏蠕虫分析图:解码音乐表演情感的 “可视化语言”
python·可视化·音乐·3d图·3d蠕虫
芝士爱知识a2 小时前
AlphaGBM 深度解析:下一代基于 AI 与蒙特卡洛的智能期权分析平台
数据结构·人工智能·python·股票·alphagbm·ai 驱动的智能期权分析·期权