从零开始学TiDB(5)Raft与Multi Raft

leader是集群中领导者,所有的读写都是走leader,follower副本不参加读写,leader会周期性的向follower发出心跳,同时也会把自己的日志同步给follower。

follower不参与读写,只会对其它服务做出相应,并同步leader的日志。如果长时间收不到leader的心跳信息,这时候follower会把自己的角色变为condidate(候选者),并发起投票。

其中一个region 及其两个副本 构成一个raft group ,多个raft group 构成了multi raft。

Raft 日志复制

  1. propose阶段客户端接收到请求操作
  2. append 阶段:raft log 已经持久化到 rocksdb raft中 (只在leader节点)
  3. replicate阶段:把leader节点的raft log 发到其它TiKV节点,同时持久化到自己的rocksdb raft中
  4. commit阶段:其它节点将raft log持久化成功后 返回leader 一个响应值,根据raft协议,超过一半返回响应成功,则commit成功
  5. Apply阶段:将raft log写入到rockdb KV中(这一步是实际的数据落盘,也就是用户层面的commit阶段)

Raft Leader选举

在集群刚开始创建时,大家都是follower,这时候每个region 都有一个计时器(election timeout),谁先到了election timeout则进入candidate 阶段并发起选举,当选leader。如果同时有多个candidate ,这时候每个region都会投票给自己,则选举失败,重新开启新一轮投票,直到选出leader。

如果此时leader宕机,followrer节点接收不到leader节点的心跳,则会倒计时(heart beat interval ),如果到了heart beat interval followrer节点将会进入candidate阶段,并发起选举,当选leader。

相关参数:

相关推荐
-KamMinG5 小时前
TIDB的备份与恢复、上传OSS
数据库·oracle·tidb
Dnui_King5 小时前
从零开始学TiDB(6)深入学习Placement Driver(PD)
学习·tidb
PingCAP1 天前
知乎 PB 级别 TiDB 数据库集群管控实践
数据库·tidb
TiDB 社区干货传送门9 天前
使用 Grafana 展示多个TiDB集群的告警
linux·服务器·数据库·tidb·grafana
TiDB_PingCAP9 天前
商业银行基于容器云的分布式数据库架构设计与创新实践
数据库·分布式·tidb·数据库架构
信徒_11 天前
mysql 和 tidb的区别
数据库·mysql·tidb
Dnui_King12 天前
从零开始学TiDB(1) 核心组件架构概述
学习·tidb
老王笔记12 天前
TiDB如何保证数据一致性
tidb
TiDB_PingCAP13 天前
基于 AutoFlow 快速搭建基于 TiDB 向量搜索的本地知识库问答机器人
机器人·tidb