首先需要明确zookeeper选举的规则:leader选举,要求 可用节点数量 > 总节点数量/2 。
比如:标记一个写是否成功是要在超过一半节点发送写请求成功时才认为有效。同样,Zookeeper选择领导者节点也是在超过一半节点同意时才有效。最后,Zookeeper是否正常是要根据是否超过一半的节点正常才算正常。这是基于CAP的一致性原理。
zookeeper有这样一个特性:集群中只要有过半的机器是正常工作的,那么整个集群对外就是可用的。
也就是说如果有2个zookeeper,那么只要有1个死了zookeeper就不能用了,因为1没有过半,所以2个zookeeper的
死亡容忍度为0;
同理,要是有3个zookeeper,一个死了,还剩下2个正常的,过半了,所以3个zookeeper的容忍度为1;
同理:
- 2->0;两个zookeeper,最多0个zookeeper可以不可用。
- 3->1;三个zookeeper,最多1个zookeeper可以不可用。
- 4->1;四个zookeeper,最多1个zookeeper可以不可用。
- 5->2;五个zookeeper,最多2个zookeeper可以不可用。
- 6->2;两个zookeeper,最多0个zookeeper可以不可用。
...
会发现一个规律,2n和2n-1的容忍度是一样的,都是n-1,所以为了更加高效,何必增加那一个不必要的zookeeper呢。
zookeeper的选举策略也是需要半数以上的节点同意才能当选leader,如果是偶数节点可能导致票数相同的情况。