学习C#调用FreeSpire.Doc包将Word转换为html

如果想在线浏览word文档内容,可以将word文档转换为pdf格式然后在线预览pdf文档,也可以将word文档转换为html在线预览,后者的话,可以采用Aspose.Words、Microsoft.Office.Interop.Word、FreeSpire.Doc等package,不过Aspose需要商业许可,Microsoft.Office.Interop.Word需要安装word软件,FreeSpire.Doc虽然免费但有限制(如下图所示),本文学习调用FreeSpire.Doc将Word转换为html的基本用法。

  VS2022新建控制台项目,在Nuget包管理器中搜索并安装FreeSpire.Doc包。

  主要调用FreeSpire.Doc包的Document类进行格式转换,主要调用以下两个函数:
  1)LoadFromFile函数,加载指定的word文档;
  2)SaveToFile函数,将文档保存为指定格式的电子文件,函数形式如下图所示,支持将word文档保存为pdf、doc、ofd、html等多种格式。

  最简单的代码仅包含3行即可将word转换为html,如下所示:

csharp 复制代码
Document doc = new Document();
doc.LoadFromFile(inputFilePath);
doc.SaveToFile(outputFilePath,FileFormat.Html);

Document类的HtmlExportOptions属性用于用于精细控制Word文档转换为HTML时的各种输出选项,其主要属性如下:

序号 属性 说明
1 CssStyleSheetType 指定CSS样式的输出方式,从枚举值CssStyleSheetType内取值
2 ImageEmbedded 是否将文档中的图片嵌入到HTML内部,布尔值
3 ImagesPath 当ImageEmbedded为false时,此属性指定图片保存的外部目录路径。HTML文件将引用此路径下的图片
4 IsTextInputFormFieldAsText 是否将Word中的文本输入型表单字段导出为纯文本
5 CssStyleSheetFileName 指定外部CSS文件的文件名
6 IsExportDocumentStyles 是否导出文档样式
7 HasHeadersFooters 是否导出页眉页脚

最后是程序运行效果,使用上述程序将之前测试导出封面和表格内容的测试文档转换为html文件,在浏览器查看时可以看到基本和在word中的内容和格式保持一致。

参考文献:

1\]https://www.e-iceblue.cn/Introduce/Free-Spire-Doc-NET.html \[2\]https://blog.csdn.net/SunnyDays1011/article/details/150770382

相关推荐
wxin_VXbishe9 小时前
C#(asp.net)学员竞赛信息管理系统-计算机毕业设计源码28790
java·vue.js·spring boot·spring·django·c#·php
bugcome_com21 小时前
零基础入门C#:一篇搞懂核心知识点
c#
晚烛1 天前
CANN + 物理信息神经网络(PINNs):求解偏微分方程的新范式
javascript·人工智能·flutter·html·零售
程序员敲代码吗1 天前
如何通过命令行启动COMSOL的参数化、批处理和集群扫描
java·c#·bash
ۓ明哲ڪ1 天前
网页视频倍速播放.
html
缺点内向1 天前
C#: 告别繁琐!轻松移除Word文档中的文本与图片水印
c#·自动化·word·.net
喵叔哟1 天前
06-ASPNETCore-WebAPI开发
服务器·后端·c#
2501_930707781 天前
使用 C# .NET 从 PowerPoint 演示文稿中提取背景图片
c#·powerpoint·.net
初级代码游戏1 天前
套路化编程 C# winform 自适应缩放布局
开发语言·c#·winform·自动布局·自动缩放
觉醒大王1 天前
哪些文章会被我拒稿?
论文阅读·笔记·深度学习·考研·自然语言处理·html·学习方法