说明:在使用Minio服务器时,无法对word文件预览,如果有需要的话,可以将word文件转为pdf文件,再存储到Minio中,本文介绍如何批量将word文件,转为pdf格式的文件;
data:image/s3,"s3://crabby-images/8efb6/8efb646208512b2eeee556f3de5ad3f2d6ee8e73" alt=""
安装库
首先,需要安装一个库,pywin32
;
data:image/s3,"s3://crabby-images/709b4/709b4c22ff4550fc9b0abcb66a865a62dc82da25" alt=""
可以在cmd窗口敲下面的命令安装,使用阿里云镜像:
powershell
pip install pywin32 -i https://mirrors.aliyun.com/pypi/simple/
如果你使用的是pycharm,我建议直接在软件里安装,如下:
data:image/s3,"s3://crabby-images/d1e09/d1e09558ae014f9bc8cc5f07b858412b5f9f41e9" alt=""
编码
代码如下:
python
import os
import time
import win32com.client
def convert_to_pdf(input_path, output_path):
# 使用win32com对象打开Word应用程序
word = win32com.client.Dispatch("Word.Application")
# 去除程序界面显示
word.Visible = 0
# 打开Word文档
doc = word.Documents.Open(input_path)
# 将Word文档保存为PDF文件
doc.SaveAs(output_path, FileFormat=17)
# 关闭Word文档
doc.Close()
# 关闭Word应用程序
word.Quit()
def main(input_path, output_path, file):
try:
# 转换为绝对路径
input_path = os.path.abspath(input_path + "\\" + file)
if file[-4:] == "docx":
output_path = os.path.abspath(output_path + "\\" + file[:-5] + ".pdf")
else:
output_path = os.path.abspath(output_path + "\\" + file[:-4] + ".pdf")
# 调用函数进行转换
convert_to_pdf(input_path, output_path)
print("转换成功!")
except Exception as e:
print(f"转换失败: {str(e)}")
if __name__ == "__main__":
# 输入路径
input_path = r""
# 输出路径
output_path = r""
# 获取输入路径下的所有文件
listdir = os.listdir(input_path)
# 遍历所有文件
for file in listdir:
# 判断是否为Word文档
if file[-4:] == "docx" or file[-3:] == "doc":
main(input_path, output_path, file)
# 休眠2秒,防止Word应用程序未关闭就进行下一次转换
time.sleep(2)
测试
例如桌面上test文件夹里,有一个word文件;
data:image/s3,"s3://crabby-images/13e4c/13e4c56e9ce0a93c19a8c2418cec97282811452c" alt=""
启动程序,进行转换;
data:image/s3,"s3://crabby-images/a374c/a374c5b8d4ef9879c3a070da1deb2ebafa245552" alt=""
转换完成;
data:image/s3,"s3://crabby-images/37950/3795025a0416d394cc36a03ec74b4f4cc5d6da99" alt=""