云事业群CTO线技术晋升考核机试题-分布式专题-D 分布式数据同步

2023****年(Q3财年)技术部门CTO线技术人员晋升考核机试题

分布式篇-D 分布式数据同步

* 参考答案*

出题人:湖北 TL 田超凡
答案制定:湖北 TL 田超凡

***** 试卷启用前绝密 ****

1 缓存一致性产生背景

答:当需要频繁访问数据库的时候,虽然数据库底层基于B+索引检索数据,但是仍然会十分消耗磁盘IO资源,导致数据库访问压力增加。

此时可以基于缓存设计来减轻数据库访问压力。

2 多级缓存架构设计方案

答:多级缓存架构设计采用的设计模式是装饰者模式。

  1. 首先是JVM内置缓存,如ehcache、oscache。数据同步可以基于RMI机制(JVM和JVM之间的通讯)实现,效率比较低。
  2. 其次是外置缓存,如redis、memcached等,先查内置缓存,内置缓存没有再查外置缓存,外置缓存没有再查数据库,然后同步数据到外置和内置缓存中。

3 Mysql与Redis缓存一致性原理

答:

  1. 基本查询流程:

首先从redis缓存中查询数据,如果能查到就直接返回客户端,如果不能查到就再到数据库中查询,把查询到的数据同步到redis缓存中,再返回查询结果给客户端。

  1. 基本数据同步实现原理:

大多数场景Redis都是作为只读缓存,当mysql做增量写操作时,会同步到Redis,此时分以下几种情况讨论:

  1. Insert db,insert redis 增量同步
  2. Update db ,清除redis缓存,懒加载
  3. Update db ,更新redis缓存,增量同步
  4. Delete db, 清除redis缓存,增量同步

4 如果数据库数据发生变化,如何同步给Redis

答:

  1. 删除redis缓存,增量同步
  2. 基于MQ异步同步
  3. 基于canal异步同步
  4. 基于canal+MQ异步同步

5 canal数据同步实现原理

答:canal主要用途是对mysql增量日志(binlog)解析,提供增量数据订阅和消费。

canal 数据同步实现原理:

  1. Canal 服务器端伪装成mysql从节点,订阅mysql主节点binlog日志
  2. 当mysql主节点binlog日志发生变化的时候,会通知给canal服务器端
  3. Canal 服务器端接收到binlog增量数据日志,解析并转换成json格式输出到canal客户端
  4. Canal 客户端接收到canal服务器端传递的增量数据日志后,异步写入到redis实现数据同步

优化建议:可以基于canal+kafka实现高效的异步数据同步,canal客户端接收到canal服务器端发送的增量数据日志后,异步将增量数据消息投递到kafka服务器端,再由kafka服务器端下游消费者订阅kafka主题,异步获取增量数据并同步到redis,大大提高大数据量数据同步场景下的数据同步效率。

相关推荐
界面开发小八哥14 小时前
「Java EE开发指南」如何用MyEclipse构建一个Web项目?(一)
java·前端·ide·java-ee·myeclipse
火烧屁屁啦2 天前
【JavaEE进阶】初始Spring Web MVC
java·spring·java-ee
Theodore_10222 天前
4 软件工程——总体设计
java·开发语言·数据库·算法·java-ee·软件工程·设计
Theodore_10222 天前
1 软件工程——概述
java·开发语言·算法·设计模式·java-ee·软件工程·个人开发
天使day3 天前
SpringMVC
java·spring·java-ee
寻找沙漠的人4 天前
理解JVM
java·jvm·java-ee
寻找沙漠的人4 天前
JavaEE 导读与环境配置
java·spring boot·java-ee
Theodore_10224 天前
3 需求分析
java·开发语言·算法·java-ee·软件工程·需求分析·需求
神的孩子都在歌唱4 天前
Java 和 J2EE 有什么不同?
java·开发语言·java-ee