分布式环境下的数据同步

一般而言elasticsearch负责搜索(查询),而sql数据负责记录(增删改),elasticsearch中的数据来自于sql数据库,因此sql数据发生改变时,elasticsearch也必须跟着改变,这个就是elasticsearch与mysql之间的数据同步

常见的数据同步的方法

同步调用

基本步骤如下:

  • hotel-demo对外提供接口,用来修改elasticsearch中的数据
  • 酒店管理服务在完成数据库操作后,直接调用hotel-demo提供的接口,

3.1.2.异步通知

流程如下:

  • hotel-admin对mysql数据库数据完成增、删、改后,发送MQ消息
  • hotel-demo监听MQ,接收到消息后完成elasticsearch数据修改

监听binlog

流程如下:

  • 给mysql开启binlog功能
  • mysql完成增、删、改操作都会记录在binlog中
  • hotel-demo基于canal监听binlog变化,实时更新elasticsearch中的内容

优缺点

方式一:同步调用

优点:实现简单,粗暴

缺点:业务耦合度高

方式二:异步通知

优点:低耦合,实现难度一般

缺点:依赖mq的可靠性

方式三:监听binlog

优点:完全解除服务间耦合

缺点:开启binlog增加数据库负担、实现复杂度高

相关推荐
灯下夜无眠31 分钟前
Spark Executor 与 Driver 在三种模式下的区别
大数据·分布式·spark
赫尔·普莱蒂科萨·帕塔1 小时前
DeepMind 分布式 AGI 安全框架与拼凑型 AI 群技术深度分析
分布式·安全·agi
Vic101012 小时前
Redis防重复点击与分布式锁
java·数据库·redis·分布式
Vic101012 小时前
Redis防重复点击与分布式锁实现方案对比笔记
java·redis·笔记·分布式
物流可信数据空间3 小时前
可信数据空间与区块链技术的结合点有哪些?
分布式·架构·区块链
Wang's Blog3 小时前
Kafka: Streams核心概念解析之KStream与KTable及实时WordCount实现
分布式·kafka
爱学大树锯3 小时前
【Zookeeper分布式锁:从原理到实战】
分布式·zookeeper·云原生
LDG_AGI3 小时前
【推荐系统】深度学习训练框架(二十):Meta Device — 延迟初始化,零显存定义超大规模模型
人工智能·pytorch·分布式·深度学习·机器学习·语言模型
Wang's Blog3 小时前
RabbitMQ: 集群深度优化:容器化高可用、网络分区处理与状态监控
网络·分布式·rabbitmq
Wang's Blog4 小时前
Kafka: 集群部署与副本机制深度解析之从伪集群搭建到生产环境实践
分布式·kafka