Raft 协议 是一种分布式共识机制,这种机制适用于网络中存在一定数量的故障节点,但不考虑"恶意"节点的情况,所以更适合作为私有链和联盟链的共识算法。
在此协议中,每个节点有三种状态:
- 候选者 ,可以被选为一个新的领导者
- 追随者 ,类似选民,追随领导者
- 选举者,对追随者发送指令,比如区块链写入区块数据,如果追随者收不到领导者的消息,则会转变为候选者
此协议达成共识分为两个阶段:
- 领导者选举
- 日志复制
领导者选举过程
它由两个时间间隔控制,分别为选举时间间隔 和心跳时间间隔 。
选举时间间隔 是指候选者成为领导者的等待时间。
开始时,每个节点都是追随者 ,每个节点独立记录自己的选举时间间隔。当A节点在选举时间间隔内没有接受到领导者的指令(心跳),则会成为候选者 ,之后此节点会向其他节点发送给自己投票的请求,其他投给此节点的节点将会重新设置自己的选举时间间隔(从零开始计时),而若是A节点获得超过半数的投票则会成为领导者 o( ̄▽ ̄ )ブ。
A在成为领导者( Leader )后,同时向其他节点发送心跳。在接收到来自节点A心跳 ,其他节点确认节点A为网络中的选举者,然后重新设置选举时间间隔并开始监听节 A的心跳。
心跳时间间隔 是指候选者接受领导者的指令的时间间隔,若是在此间隔内未接收到心跳(指令)则会成为候选者o( ̄▽ ̄ )ブ。
同样每个追随者都会记录自己的心跳时间间隔,若B节点在此间隔内未收到领导者A的心跳(假设A发生了故障),B则会变为候选者,向其他节点发送给他投票的请求,其他节点则会停止对A的心跳监听,开始下一轮的投票,并重新设置自己的选举时间间隔。
每一个追随者一直监听领导者的心跳,如果在心跳时间间隔内没有接收到心跳,在等待一个选举时间间隔后,则会变为候选者(即每个追随者都记录着心跳时间间隔和选举时间间隔)。
若是在某一个时刻,有两个节点(均没有接收到请求或者心跳)同时成为候选者,则会分别发起投票(各自投各自一票),由于发送请求存在先后顺序且每个节点在一轮选举中只能投一次票,故经过多轮选举,最后都会产生领导者。
日志复制
作为领导者的节点掌握整个网络的日志复制(比如记录区块)的工作。
例如,领导者会向追随者发送添加区块到区块链的命令,但领导者不会立即将区块数据添加到区块链,而是在得到大多数追随者的确认才会更新自己的区块链的信息,也会在下一次的心跳通知追随者更新区块链的信息。
由Raft协议原理可知,对于私有链,如果网络中永远不会发生通信故障,则本质上是类中心化的区块链,因为所有的区块链都会由第一个领导者产生。