前提
现在在做一个在线生成文档的东西,就是用户填写的时候都是结构化的东西,不如单选框,多选框,富文本,图片之类的,最后要给用户生成文档或者ppt,或者pdf,然后要做一个版本对比的功能,粒度比较粗糙,只需要知道每次发布之后,有哪些章节发生了变更就可以,不关心具体哪一行或者哪一个字发生了变化。
实现
什么时候计算变更?
有两个实现方案
方案一
每次发布之前,统一计算所有章节的变更情况
方案二把计算放在平时,每次保存或者更新,都计算一下当前章节的变更情况。
两种方案各有利弊,最终选择了第二种,这种的优点在于,不必等待发布操作即可看到变更情况,方便以后加功能吧。
怎么计算呢?
MD5,是的,就是计算章节的MD5,我们的章节可以人为划分成几部分,比如章节信息,内容块信息,等等,每次保存的时候,涉及到哪块儿就计算哪块儿的MD5,并和上一版本进行对比,保存一下变更情况。
未解决:变更对比
实际上就是git的diff功能,目前不支持,git的diff应该也是在每次执行的时候才去计算,这个之后再考虑了,留个文章给自己参考一下:Git 是怎样生成 diff 的:Myers 算法