pdf文档转word文档

很久以前写的代码了,当时好象是因为朋友临时需要,找了好几个工具都是要付费,单独为了一个文档花钱好象有点划不来,就用python简单做了个,今天不小心划拉了出来,反正收着也没什么用,贴出来开心一下。

另外说一下,实现时导入了os与pdf2docx库,因为os的使用,做成exe后容易被360等识别,添加进信任就可以了。

pdf转docx

python 复制代码
# 珠晖
import os
from pdf2docx import Converter

def pdf_docx():
    # 获取当前工作目录
    file_path = os.getcwd()

    # 遍历所有文件
    for file in os.listdir(file_path):
        # 获取文件后缀
        suff_name = os.path.splitext(file)[1]

        # 过滤非pdf格式文件
        if suff_name != '.pdf':
            continue
        # 获取文件名称
        file_name = os.path.splitext(file)[0]
        # pdf文件名称
        pdf_name = os.getcwd() + '\\' + file
        # 要转换的docx文件名称
        docx_name = os.getcwd() + '\\' + file_name + '.docx'
        # 加载pdf文档
        cv = Converter(pdf_name)
        cv.convert(docx_name)
        cv.close()
pdf_docx()

python代码实现步骤:

  • 导入os库实现文件操作
  • 导入pdf2docx库实现文档转换
  • 遍历当前文件夹下所有文件
  • 找到PDF文档
  • 转换文件名
  • 保存文件
  • 重复上述步骤完成所有PDF至DOCX的转换
相关推荐
LostSpeed1 小时前
在福昕(pdf)阅读器中导航到上次阅读页面的方法
pdf
旭久1 小时前
SpringBoot的Thymeleaf做一个可自定义合并td的pdf表格
pdf·html·springboot
雕刻刀7 小时前
Latex 转换为 Word(使用GrindEQ )(英文转中文,毕业论文)
word
觅远18 小时前
python实现word转html
python·html·word
养个小橘猫18 小时前
Word使用分隔符实现页面部分分栏
word
神色自若21 小时前
Net9为PDF文字替换,使用Spire.PDF版本10.12.4.1360
pdf
机器懒得学习1 天前
解析交通事故报告:利用 PDF、AI 与数据标准化技术构建智能分析系统
pdf
SEO-狼术1 天前
Document Solutions for Word CRACK
word
合合技术团队2 天前
高效准确的PDF解析工具,赋能企业非结构化数据治理
人工智能·科技·pdf·aigc·文档