pdf文档转word文档

很久以前写的代码了,当时好象是因为朋友临时需要,找了好几个工具都是要付费,单独为了一个文档花钱好象有点划不来,就用python简单做了个,今天不小心划拉了出来,反正收着也没什么用,贴出来开心一下。

另外说一下,实现时导入了os与pdf2docx库,因为os的使用,做成exe后容易被360等识别,添加进信任就可以了。

pdf转docx

python 复制代码
# 珠晖
import os
from pdf2docx import Converter

def pdf_docx():
    # 获取当前工作目录
    file_path = os.getcwd()

    # 遍历所有文件
    for file in os.listdir(file_path):
        # 获取文件后缀
        suff_name = os.path.splitext(file)[1]

        # 过滤非pdf格式文件
        if suff_name != '.pdf':
            continue
        # 获取文件名称
        file_name = os.path.splitext(file)[0]
        # pdf文件名称
        pdf_name = os.getcwd() + '\\' + file
        # 要转换的docx文件名称
        docx_name = os.getcwd() + '\\' + file_name + '.docx'
        # 加载pdf文档
        cv = Converter(pdf_name)
        cv.convert(docx_name)
        cv.close()
pdf_docx()

python代码实现步骤:

  • 导入os库实现文件操作
  • 导入pdf2docx库实现文档转换
  • 遍历当前文件夹下所有文件
  • 找到PDF文档
  • 转换文件名
  • 保存文件
  • 重复上述步骤完成所有PDF至DOCX的转换
相关推荐
一个处女座的程序猿4 小时前
LLMs之PDF:zeroX(一款PDF到Markdown 的视觉模型转换工具)的简介、安装和使用方法、案例应用之详细攻略
pdf·markdown·zerox
Dxy12393102164 小时前
python下载pdf
数据库·python·pdf
周亚鑫4 小时前
vue3 pdf base64转成文件流打开
前端·javascript·pdf
一名技术极客6 小时前
Vue2 doc、excel、pdf、ppt、txt、图片以及视频等在线预览
pdf·powerpoint·excel·文件在线预览
Jacob程序员8 小时前
java导出word文件(手绘)
java·开发语言·word
q2498596938 小时前
前端预览word、excel、ppt
前端·word·excel
flashman9119 小时前
python在word中插入图片
python·microsoft·自动化·word
hairenjing112315 小时前
使用 Mac 数据恢复从 iPhoto 图库中恢复照片
windows·stm32·嵌入式硬件·macos·word
S. Dylan19 小时前
Edge浏览器打开PDF无法显示电子签章
edge·pdf
一马平川的大草原19 小时前
如何基于pdf2image实现pdf批量转换为图片
计算机视觉·pdf·文件拆分