【学习笔记】kafka权威指南——第8章 跨集群数据镜像(7-10章只做了解)

第8章 跨集群数据镜像

8.1 跨集群数据镜像的使用场景

1>区域集群与中心集群:

中心集群会需要区域集群的消息

2>冗余

完全的kafka镜像备用集群

3>云迁移

8.2 多集群架构

8.2.1 跨数据中心通信的一些实现情况

1>高延迟:集群距离越远,延迟越高,主要因为网络跳转

2>有限的带宽

3>高成本:带宽增加很消耗成本

【向远程数据中心生成数据需要增大retry次数并增大缓冲区】

【一个数据中心需要从另一个数据中心获取数据时推荐使用镜像,而不是消费者】

多集群架构原则:

1>每个数据中心至少有一个kafka集群

2>每两个数据中心之间的每个时间仅复制一次

3>尽量从远程中心读取数据,而不是写入

本地数据保存同步至全部数据中心,而应用程序也可以处理所有数据,但需要很好的处理异步数据读取与更新问题

【需处理循环镜像,可以为同一个逻辑topic在两个中心创建A.topic、B.topic,并在一个镜像本地写入A,镜像复制入B,另一个中心则相反】

8.2.4 主备架构

主备存在的问题:

1>数据丢失和不一致性

2>失效备援之后的起始偏移量

3>复制偏移量topic

【0.10.0之后可以使用时间获取偏移量(基于消息的时间),可以在外部存储偏移量映射】

4>在使用备用kafka集群后

一般清理旧的主集群,将已运行的备用集群数据绘制到旧集群上,打成一致性

5>关于集群发现

切换备份时,需切换kafka集群地址,推荐使用DNS映射无痛切换,并重启消费者程序

8.2.5 延展集群

(三个数据中心)

8.3 kafka的MirrorMaker

8.4 其他方案

1>UReplicator:解决多次再平衡问题

2>Confluent的Replicator:解决配置同步与集群管理问题

相关推荐
wdfk_prog3 小时前
[Linux]学习笔记系列 -- lib/timerqueue.c Timer Queue Management 高精度定时器的有序数据结构
linux·c语言·数据结构·笔记·单片机·学习·安全
wdfk_prog4 小时前
构建基于Hexo、Butterfly、GitHub与Cloudflare的高性能个人博客
笔记·学习·github·hexo·blog
初级炼丹师(爱说实话版)4 小时前
MySql速成笔记6(DQL多表)
笔记
shixian10304114 小时前
Django 学习日志
数据库·学习·sqlite
小秋学嵌入式-不读研版4 小时前
C61-结构体数组
c语言·开发语言·数据结构·笔记·算法
丰锋ff5 小时前
2013 年真题配套词汇单词笔记(考研真相)
笔记·学习·考研
小小程序媛(*^▽^*)6 小时前
第十二届全国社会媒体处理大会笔记
人工智能·笔记·学习·ai
铁手飞鹰6 小时前
VS2022创建项目工程笔记
c++·windows·笔记·visualstudio
毕设源码-邱学长6 小时前
【开题答辩全过程】以 爱学习教育网站为例,包含答辩的问题和答案
学习