使用Python批量将Word文件转为PDF文件

说明:在使用Minio服务器时,无法对word文件预览,如果有需要的话,可以将word文件转为pdf文件,再存储到Minio中,本文介绍如何批量将word文件,转为pdf格式的文件;

安装库

首先,需要安装一个库,pywin32

可以在cmd窗口敲下面的命令安装,使用阿里云镜像:

powershell 复制代码
pip install pywin32 -i https://mirrors.aliyun.com/pypi/simple/

如果你使用的是pycharm,我建议直接在软件里安装,如下:

编码

代码如下:

python 复制代码
import os
import time

import win32com.client


def convert_to_pdf(input_path, output_path):
    # 使用win32com对象打开Word应用程序
    word = win32com.client.Dispatch("Word.Application")

    # 去除程序界面显示
    word.Visible = 0

    # 打开Word文档
    doc = word.Documents.Open(input_path)

    # 将Word文档保存为PDF文件
    doc.SaveAs(output_path, FileFormat=17)

    # 关闭Word文档
    doc.Close()

    # 关闭Word应用程序
    word.Quit()


def main(input_path, output_path, file):
    try:
        # 转换为绝对路径
        input_path = os.path.abspath(input_path + "\\" + file)

        if file[-4:] == "docx":
            output_path = os.path.abspath(output_path + "\\" + file[:-5] + ".pdf")
        else:
            output_path = os.path.abspath(output_path + "\\" + file[:-4] + ".pdf")

        # 调用函数进行转换
        convert_to_pdf(input_path, output_path)
        print("转换成功!")
    except Exception as e:
        print(f"转换失败: {str(e)}")


if __name__ == "__main__":
    # 输入路径
    input_path = r""

    # 输出路径
    output_path = r""

    # 获取输入路径下的所有文件
    listdir = os.listdir(input_path)

    # 遍历所有文件
    for file in listdir:

        # 判断是否为Word文档
        if file[-4:] == "docx" or file[-3:] == "doc":
            main(input_path, output_path, file)

            # 休眠2秒,防止Word应用程序未关闭就进行下一次转换
            time.sleep(2)

测试

例如桌面上test文件夹里,有一个word文件;

启动程序,进行转换;

转换完成;

相关推荐
m0_613856291 小时前
mysql如何利用事务隔离级别解决特定业务冲突_mysql隔离方案选型
jvm·数据库·python
我的xiaodoujiao2 小时前
API 接口自动化测试详细图文教程学习系列16--项目实战演练3
python·学习·测试工具·pytest
ID_180079054732 小时前
Python 实现亚马逊商品详情 API 数据准确性校验(极简可用 + JSON 参考)
java·python·json
时空系2 小时前
第10篇:继承扩展——面向对象编程进阶 python中文编程
开发语言·python·ai编程
CHANG_THE_WORLD3 小时前
python 批量终止进程exe
开发语言·python
liann1194 小时前
3.2_红队攻击框架--MITRE ATT&CK‌
python·网络协议·安全·网络安全·系统安全·信息与通信
云天AI实战派4 小时前
AI 智能体问题排查指南:ChatGPT、API 调用到 Agent 上线失灵的全流程修复手册
大数据·人工智能·python·chatgpt·aigc
我的xiaodoujiao4 小时前
API 接口自动化测试详细图文教程学习系列15--项目实战演练2
python·学习·测试工具·pytest
多思考少编码5 小时前
PAT甲级真题1001 - 1005题详细题解(C++)(个人题解)
c++·python·最短路·pat·算法竞赛
ZhengEnCi5 小时前
M5-markconv自定义CSS样式指南 📝
前端·css·python