摩尔定律揭示了集成电路每18个月计算性能就会增加一倍。
Zookeeper以Fast Paxos算法为基础。
在一个大型应用中,经常会按照功能边界将应用分为多个模块,这些模块可以分别独立部署。而要完成某一项具体的功能,不能仅靠其中一个模块,需要多个模块一起配合工作。如何让一个应用中多个模块之间协同工作是一件非常困难的事情。
Zookeeper的设计保证了健壮性,可以让开发者更多的关注到自己的应用程序逻辑本身,不必过多的考虑程序模块之间的协同工作。
关于zookeeper的核心功能
用于在分布式系统中协作多个任务,一个协作任务是指一个包含多个进程的任务。这个任务可以是为了协作和管理竞争。
协作是指多个进程共同处理某些事情,一个进程采取某些行动使得其他进程可以继续工作。比如在典型的主从架构中,从节点处于空闲状态会通知主节点,说明其可以接收下一项任务,于是主节点便会分配任务给从节点。
竞争是指两个进程不能同时处理一项工作,其中一个进程必须等待另一个进程处理完成才能继续进行。例如还是在主从架构中,进行主节点选举时,很多节点都想成为主节点,所以此时必须通过互斥排他锁来保证只有一个节点成为主节点。
Zookeeper使用实例
HBase
在HBase中,Zookeeper用于选举一个集群内的主节点。
Kafka
在Kafka中,Zookeeper用于崩溃检测,实现主题(Topic)的发现,并保持主题的生产和消费状态。
Zookeeper名字的来源
ZooKeeper由雅虎研究院开发。小组也一同致力于Hadoop项目,参与了很多动物命名的项目,其中有广为人知的Apache Pig项目。
分布式系统就像动物园中的各种动物,混乱且难以管理,而Zookeeper就是将这一切变得可控。
Zookeeper解决了什么问题
使用ZooKeeper可以让开发人员更专注于其应用本身的逻辑而不是神秘的分布式系统概念。
Zookeeper不适合的场景
ZooKeeper不适合用作海量数据存储。
关于分布式系统的定义
同时跨越多个物理主机,独立运行的多个软件组件所组成的系统。
为什么要采用分布式去设计系统
- 充分利用多处理器的运算能力来运行组件。
- 一个系统由于战略的原因,需要分布在多个地域,例如一个应用需要多个不同地点的服务器提供服务。
分布式系统的各进程之间如何通信?
- 通过网络进行信息交换。
- 读写某些共享存储。
网络通信是分布式系统中并发设计的基础。