【Zookeeper】一、Zookeeper的使命

摩尔定律揭示了集成电路每18个月计算性能就会增加一倍。

Zookeeper以Fast Paxos算法为基础。

在一个大型应用中,经常会按照功能边界将应用分为多个模块,这些模块可以分别独立部署。而要完成某一项具体的功能,不能仅靠其中一个模块,需要多个模块一起配合工作。如何让一个应用中多个模块之间协同工作是一件非常困难的事情。

Zookeeper的设计保证了健壮性,可以让开发者更多的关注到自己的应用程序逻辑本身,不必过多的考虑程序模块之间的协同工作。

关于zookeeper的核心功能

用于在分布式系统中协作多个任务,一个协作任务是指一个包含多个进程的任务。这个任务可以是为了协作和管理竞争。

协作是指多个进程共同处理某些事情,一个进程采取某些行动使得其他进程可以继续工作。比如在典型的主从架构中,从节点处于空闲状态会通知主节点,说明其可以接收下一项任务,于是主节点便会分配任务给从节点。

竞争是指两个进程不能同时处理一项工作,其中一个进程必须等待另一个进程处理完成才能继续进行。例如还是在主从架构中,进行主节点选举时,很多节点都想成为主节点,所以此时必须通过互斥排他锁来保证只有一个节点成为主节点。

Zookeeper使用实例
HBase

在HBase中,Zookeeper用于选举一个集群内的主节点。

Kafka

在Kafka中,Zookeeper用于崩溃检测,实现主题(Topic)的发现,并保持主题的生产和消费状态。

Zookeeper名字的来源

ZooKeeper由雅虎研究院开发。小组也一同致力于Hadoop项目,参与了很多动物命名的项目,其中有广为人知的Apache Pig项目。

分布式系统就像动物园中的各种动物,混乱且难以管理,而Zookeeper就是将这一切变得可控。

Zookeeper解决了什么问题

使用ZooKeeper可以让开发人员更专注于其应用本身的逻辑而不是神秘的分布式系统概念。

Zookeeper不适合的场景

ZooKeeper不适合用作海量数据存储。

关于分布式系统的定义

同时跨越多个物理主机,独立运行的多个软件组件所组成的系统。

为什么要采用分布式去设计系统
  • 充分利用多处理器的运算能力来运行组件。
  • 一个系统由于战略的原因,需要分布在多个地域,例如一个应用需要多个不同地点的服务器提供服务。
分布式系统的各进程之间如何通信?
  • 通过网络进行信息交换。
  • 读写某些共享存储。

网络通信是分布式系统中并发设计的基础。

相关推荐
Data跳动2 小时前
Spark内存都消耗在哪里了?
大数据·分布式·spark
Java程序之猿3 小时前
微服务分布式(一、项目初始化)
分布式·微服务·架构
来一杯龙舌兰4 小时前
【RabbitMQ】RabbitMQ保证消息不丢失的N种策略的思想总结
分布式·rabbitmq·ruby·持久化·ack·消息确认
节点。csn6 小时前
Hadoop yarn安装
大数据·hadoop·分布式
NiNg_1_2347 小时前
基于Hadoop的数据清洗
大数据·hadoop·分布式
隔着天花板看星星8 小时前
Spark-Streaming集成Kafka
大数据·分布式·中间件·spark·kafka
技术路上的苦行僧13 小时前
分布式专题(8)之MongoDB存储原理&多文档事务详解
数据库·分布式·mongodb
龙哥·三年风水13 小时前
workman服务端开发模式-应用开发-后端api推送修改二
分布式·gateway·php
小小工匠13 小时前
分布式协同 - 分布式事务_2PC & 3PC解决方案
分布式·分布式事务·2pc·3pc
闯闯的日常分享16 小时前
分布式锁的原理分析
分布式