如何保证ES和数据库的数据一致性?

在业务中,我们通常需要把数据库中的数据变更同步到ES中,那么如何保证数据库和ES的一致性呢?通常有以下几种做法:

双写

在代码中,对数据库和ES进行双写,并且先操作本地数据库,后操作ES,而且还需要把两个操作放到一个事务中:

在以上逻辑中,如果写数据库成功,写ES失败,那么事务会回滚。

如果写数据库成功,写ES超时,实际上ES操作成功,这时候数据库会回滚,导致数据不一致。这时候需要重试保证最终一致性。

这个方案的好处就是简单,容易实现。并且实时性比较高。

缺点首先是需要改代码,有入侵性,还有就是存在不一致的情况。并且在本地事务中发生了外调ES,大大拖长了事务,白白占用数据库连接,影响整体的吞吐量。

MQ异步消费

在应用中,如果我要更新数据库了,那么久抛出一个消息出去,然后数据库和ES各自有一个监听者,监听消息之后自去做数据变更,如果失败了就基于消息的重试在重新执行。

或者像之前那个方案一样,先操作数据库,然后异步通知ES去更新,这时候就可以借助本地消息表的方式来保证最终一致性了。

这个方案的好处是用了MQ,起到了解耦的的作用,而且还做到了异步,提升了整体性能。

缺点就是MQ可能存在延迟,并且需要引入新的中间件,复杂度有所提升。

扫表定时同步

如果是ES中的数据变更的实时性要求不高,可以考虑定时任务扫表,然后批量更新ES

这个方案优点没有侵入性,数据库的写操作处不需要改代码。

缺点是实时性很差,并且轮询可能存在性能问题,效率问题以及给数据库带来压力。

监听binlog同步

还有一种方案,就是可以利用数据库变更时产生的binlog来更新ES。通过监听binlog来更新ES中的数据,也有成熟的框架可以做这样的事情。

好处就是对业务代码完全没有侵入性,业务也非常解耦,不需要关系这个ES的更新操作。

缺点就是需要基于binlog监听,需要引入第三方框架。存在一定的延迟。

总结一下,目前业内比较流行的方案是基于binlog监听的这种,首先一般业务量小的业务也不太需要用ES,所以用了ES的团队,一般并不太会关系引入新框架的复杂度问题,而且ES这种搜索,一般来说,毫秒级的延迟都可以接受的,所以,综合来讲,基于canal做数据同步的方案,比较合适的

相关推荐
天翼云开发者社区9 分钟前
Doris-HDFS LOAD常见问题汇总(二)
大数据·doris
小小不董11 分钟前
深入理解oracle ADG和RAC
linux·服务器·数据库·oracle·dba
简婷1870199877534 分钟前
源网荷储 + 零碳园区:一场关于能源与未来的双向奔赴
大数据·人工智能·能源
2201_756776771 小时前
网络安全初级
大数据·elasticsearch·搜索引擎
胚芽鞘6811 小时前
查询依赖冲突工具maven Helper
java·数据库·maven
宇钶宇夕1 小时前
SIMATIC S7-1200的以太网通信能力:协议与资源详细解析
运维·服务器·数据库·程序人生·自动化
m0_703323671 小时前
SEO外包服务甄选指南:避开陷阱,精准匹配
大数据·人工智能
LuckyLay2 小时前
1.1.1数据类型与变量——AI教你学Django
数据库·django·sqlite
zzywxc7872 小时前
AI技术通过提示词工程(Prompt Engineering)正在深度重塑职场生态和行业格局,这种变革不仅体现在效率提升,更在重构人机协作模式。
java·大数据·开发语言·人工智能·spring·重构·prompt
张先shen2 小时前
Elasticsearch RESTful API入门:索引的增删改查完全指南
java·大数据·elasticsearch·搜索引擎·架构·全文检索·restful