python实现word转html

目录

使用mammoth库

使用spire.doc库


使用mammoth库

mammoth库支持将word转为HTML和markdown格式的文件。

python 复制代码
import mammoth

def word_html(word_file):
    html_save_name = fr'{word_file.split('.')[0]}.html'
    with open(word_file, 'rb') as f:
        data = mammoth.convert_to_html(f)
    with open(html_save_name, 'w') as f:
        f.write(data.value)

使用spire.doc库

强大的word文件处理库,不太好的就是商业库转换出的文件有水印。

python 复制代码
from spire.doc import Document, FileFormat


def word_html(word_file):
    html_save_name = fr'{word_file.split('.')[0]}.html'
    doc = Document()
    doc.LoadFromFile(word_file)

    doc.SaveToFile(html_save_name, FileFormat.Html)
    doc.Close()
    with open(html_save_name, 'r', encoding='utf-8') as f:
        data = f.read().replace('Evaluation Warning: The document was created with Spire.Doc for Python.', '')  # 去掉商业库spire.doc生成的水印信息
    with open(html_save_name, 'w', encoding='utf-8') as f:
        f.write(data)
相关推荐
ZTLJQ1 小时前
序列化的艺术:Python JSON处理完全解析
开发语言·python·json
H5css�海秀1 小时前
今天是自学大模型的第一天(sanjose)
后端·python·node.js·php
阿贵---2 小时前
使用XGBoost赢得Kaggle比赛
jvm·数据库·python
无敌昊哥战神2 小时前
【LeetCode 257】二叉树的所有路径(回溯法/深度优先遍历)- Python/C/C++详细题解
c语言·c++·python·leetcode·深度优先
李昊哲小课3 小时前
第1章-PySide6 基础认知与环境配置
python·pyqt·pyside
2401_894241924 小时前
用Pygame开发你的第一个小游戏
jvm·数据库·python
Zzzz_my5 小时前
正则表达式(RE)
pytorch·python·正则表达式
天天鸭5 小时前
前端仔写了个 AI Agent,才发现大模型只干了 10% 的活
前端·python·ai编程
setmoon2146 小时前
使用Scikit-learn构建你的第一个机器学习模型
jvm·数据库·python
2401_833197736 小时前
为你的Python脚本添加图形界面(GUI)
jvm·数据库·python