分布式环境下的数据同步

一般而言elasticsearch负责搜索(查询),而sql数据负责记录(增删改),elasticsearch中的数据来自于sql数据库,因此sql数据发生改变时,elasticsearch也必须跟着改变,这个就是elasticsearch与mysql之间的数据同步

常见的数据同步的方法

同步调用

基本步骤如下:

  • hotel-demo对外提供接口,用来修改elasticsearch中的数据
  • 酒店管理服务在完成数据库操作后,直接调用hotel-demo提供的接口,

3.1.2.异步通知

流程如下:

  • hotel-admin对mysql数据库数据完成增、删、改后,发送MQ消息
  • hotel-demo监听MQ,接收到消息后完成elasticsearch数据修改

监听binlog

流程如下:

  • 给mysql开启binlog功能
  • mysql完成增、删、改操作都会记录在binlog中
  • hotel-demo基于canal监听binlog变化,实时更新elasticsearch中的内容

优缺点

方式一:同步调用

优点:实现简单,粗暴

缺点:业务耦合度高

方式二:异步通知

优点:低耦合,实现难度一般

缺点:依赖mq的可靠性

方式三:监听binlog

优点:完全解除服务间耦合

缺点:开启binlog增加数据库负担、实现复杂度高

相关推荐
轻刀快马2 小时前
穿透 MQ 专栏 (五):【终局之战】MySQL 和 MQ 的世纪联姻:扒开“分布式事务”的遮羞布
数据库·分布式·消息队列
列星随旋5 小时前
Kafka基础篇
分布式·kafka
Jackyzhe5 小时前
从零学习Kafka:生产者压缩
分布式·学习·kafka
一只普通的码农6 小时前
kafka在windows环境部署
分布式·kafka
Kiyra7 小时前
异步任务不用 Kafka 也行:用 Redis Stream 搭一套轻量级 Producer/Consumer 框架
数据库·人工智能·redis·分布式·后端·缓存·kafka
老码观察8 小时前
分布式系统核心理论与实践:从CAP到工程落地
分布式
赵渝强老师9 小时前
【赵渝强老师】Hadoop的伪分布部署模式
大数据·hadoop·分布式
Mike117.9 小时前
GBase 8c 序列取值在分布式业务里的几个风险点
分布式
淡定一生23339 小时前
spark 3.3+ 之BloomFilter Runtime Filter
大数据·分布式·spark
霑潇雨9 小时前
原生 Zookeeper 实现分布式锁案例
java·分布式·zookeeper·云原生·maven