研究一下前端导出word,顺便给开源项目(docx)提了个pr

一、前言

最近项目上有个需求要实现在前端将内容转成word导出的功能,经过一番调研尝试下面这几个库,这里简单做一下总结:

docx文件其实是一个压缩包,当你把文件后缀改为.zip后解压缩,就会发现咱们编辑的内容本质上都是一些xml文件,也就是说平时用到的word/wps等软件也可以理解为一个xml文件可视化编辑工具!

offic文件的xml内容都遵循同一套标准Microsoft Office Open XML ,也就是说无论用什么方式,只要生成符合对应标准的文件,那么word/wps就都能正常使用。相关工具库其实也都是在基于这个标准进行xml内容的解析或生成。

  • docxtemplater (3.3k):基于模板,通过替换变量的方式生成文件,也就是只要先写好模板文件,能够实现100%还原word格式文件效果。特别适用于实现提供了固定文件模板的导出需求。
  • officegen (2.7k): 基于json配置或自定义代码控制生成内容,可以支持docx\pptx\xlsx多种格式。这里我只尝试过导出docx,就我个人体验来说,api相对来说比较精简易上手,如果只是涉及到简单的文本样式效果,首推这个,几分钟就上手解决问题~
  • docx.js (4.8k):基于代码控制生成内容,文档详细,几乎提供了所有docx常用功能,个性化配置项非常丰富,满足了我的所有需求!最终项目中选择的也是这个库。

二、定位问题

在开发的正起劲的时候发现,按文档描述使用api导出word评论只显示占位区域,无法正确加载图片!按文档描述任何知乎在段落中支持的功能,在评论中都应该可以使用。


于是我解压并打开了xml文件尝试排查原因,最终发现了端倪

在这个错误的xml文件中,图片引用部分是的直接解析成了文件名称

而正确的xml文件中图片资源应该是在comments.xml.rels文件中描述rid和资源路径的引用关系,comments.xml中使用对应的rid

所以想要支持在评论区中导出图片,我就需要做两个方面的改动

  1. 生成一个comments.xml.rels文件
  2. 替换comments.xml中的图片引用字段

三、解决问题

阅读源码发现,虽然作者并没有处理comment图片资源等相关的代码,但是存在生成document.xml.refs文件的相关逻辑可以参考实现,这不就直接就有了思路!

  1. 构建资源引用关系。在评论类中,添加了一个引用关系来保存图片引用
  2. 处理comments.xml文件信息。这里直接参考原本docmentXmlData的处理过程来处理commentXmlData生成comments.xml文件的时候同样参照生成docment的方式,实现图片资源索引的关键字符替换。
  3. 将评论相关的图片资源数据处理生成comment.xml.refs文件。
  4. 修改demo文件测试。找到原本用来测试comment功能的测试文件,引入图片再进行导出测试检查功能正常,完结撒花!
  5. 给项目提交pr,具体流程我就不多赘述了,可参考下面这篇文章: 如何给一个github项目提pr

四、总结

通过实现这个需求,浅入了解了下word文档规范,并且也尝试给开源项目提交了第一个pr,为开源做出一份自己的贡献。最后如果有其他更好用的docx生成库,也可以分享一下~

ps:js生态里office相关的工具库和后端比成熟度还是差很多呀,各大厂的在线文档实现方案好像也都是在服务器生成,前端直接下载了。

相关推荐
bug_kada几秒前
手把手教你做一个React Hooks (Todos)应用(一)
前端·react.js
EndingCoder3 分钟前
打包应用:使用 Electron Forge
前端·javascript·性能优化·electron·前端框架·打包·electron forge
子兮曰4 分钟前
🔥告别ORM臃肿!用Bun.js原生SQLite打造极致轻量级数据库层
前端·sqlite·bun
鹏多多5 分钟前
Vue3响应式原理Proxy的深度剖析
前端·javascript·vue.js
不可能的是5 分钟前
深度解析:Sass-loader Legacy API 警告的前世今生与完美解决方案
前端·javascript
情绪的稳定剂_精神的锚6 分钟前
VSCODE开发一个代码规范的插件入门
前端
养老不躺平10 分钟前
关于nest项目打包
前端·javascript
Mike_jia1 小时前
uuWAF:开源Web应用防火墙新标杆——从工业级防护到智能防御实战解析
前端
掘金安东尼1 小时前
Chrome 17 岁了——我们的浏览器简史
前端·javascript·github
袁煦丞1 小时前
群晖NAS FTP远程文件仓库全球访问:cpolar内网穿透实验室第524个成功挑战
前端·程序员·远程工作