使用python做了一个pdf转word的小工具

写在前面:近来工作上一直在处理word excel等文档的处理;于是利用新学的python写了一个小工具

1、其实实现起来很简单,主要是利用了pdf2docx这个库来实现

首先安装导入pdf2docx库

python 复制代码
pip install pdf2docx

2、代码部分:

话不多说直接上代码:

python 复制代码
import os
from pdf2docx import Converter
from loguru import logger
from tkinter import Tk, filedialog

# 获取到当前路径
path = os.getcwd()

# 打开文件选择对话框,选择要转换的PDF文件
def choose_pdf_file():
    root = Tk()
    root.withdraw()
    file_path = filedialog.askopenfilename(filetypes=[("PDF Files", "*.pdf")])
    root.destroy()
    return file_path

def main():
    # 选择要转换的PDF文件
    pdf_file = choose_pdf_file()

    if not pdf_file:
        logger.debug("未选择任何PDF文件。")
        return

    docx_file = os.path.splitext(pdf_file)[0] + ".docx"
    logger.debug("原始的PDF文件为-------%s" % pdf_file)

    cv = Converter(pdf_file)
    cv.convert(docx_file)
    logger.debug("转换之后的DOCX文件为-------%s" % docx_file)
    cv.close()

if __name__ == "__main__":
    main()
相关推荐
吴秋霖2 分钟前
【某音电商】protobuf聊天协议逆向
python·算法·protobuf
深藏功yu名3 分钟前
Day24:向量数据库 Chroma_FAISS 入门
数据库·人工智能·python·ai·agent·faiss·chroma
cm65432034 分钟前
用Python破解简单的替换密码
jvm·数据库·python
wan9yu1 小时前
为什么你需要给 LLM 的数据"加密"而不是"脱敏"?我写了一个开源工具
python
摇滚侠1 小时前
你是一名 java 程序员,总结定义数组的方式
java·开发语言·python
这个名有人用不1 小时前
解决 uv 虚拟环境使用 pip 命令提示command not found的办法
python·pip·uv·claude code
Oueii2 小时前
掌握Python魔法方法(Magic Methods)
jvm·数据库·python
2501_908329852 小时前
使用Python自动收发邮件
jvm·数据库·python
开开心心就好2 小时前
免费自媒体多功能工具箱,图片音视频处理
人工智能·pdf·ocr·excel·音视频·语音识别·媒体