【Zookeeper】一、Zookeeper的使命

摩尔定律揭示了集成电路每18个月计算性能就会增加一倍。

Zookeeper以Fast Paxos算法为基础。

在一个大型应用中,经常会按照功能边界将应用分为多个模块,这些模块可以分别独立部署。而要完成某一项具体的功能,不能仅靠其中一个模块,需要多个模块一起配合工作。如何让一个应用中多个模块之间协同工作是一件非常困难的事情。

Zookeeper的设计保证了健壮性,可以让开发者更多的关注到自己的应用程序逻辑本身,不必过多的考虑程序模块之间的协同工作。

关于zookeeper的核心功能

用于在分布式系统中协作多个任务,一个协作任务是指一个包含多个进程的任务。这个任务可以是为了协作和管理竞争。

协作是指多个进程共同处理某些事情,一个进程采取某些行动使得其他进程可以继续工作。比如在典型的主从架构中,从节点处于空闲状态会通知主节点,说明其可以接收下一项任务,于是主节点便会分配任务给从节点。

竞争是指两个进程不能同时处理一项工作,其中一个进程必须等待另一个进程处理完成才能继续进行。例如还是在主从架构中,进行主节点选举时,很多节点都想成为主节点,所以此时必须通过互斥排他锁来保证只有一个节点成为主节点。

Zookeeper使用实例
HBase

在HBase中,Zookeeper用于选举一个集群内的主节点。

Kafka

在Kafka中,Zookeeper用于崩溃检测,实现主题(Topic)的发现,并保持主题的生产和消费状态。

Zookeeper名字的来源

ZooKeeper由雅虎研究院开发。小组也一同致力于Hadoop项目,参与了很多动物命名的项目,其中有广为人知的Apache Pig项目。

分布式系统就像动物园中的各种动物,混乱且难以管理,而Zookeeper就是将这一切变得可控。

Zookeeper解决了什么问题

使用ZooKeeper可以让开发人员更专注于其应用本身的逻辑而不是神秘的分布式系统概念。

Zookeeper不适合的场景

ZooKeeper不适合用作海量数据存储。

关于分布式系统的定义

同时跨越多个物理主机,独立运行的多个软件组件所组成的系统。

为什么要采用分布式去设计系统
  • 充分利用多处理器的运算能力来运行组件。
  • 一个系统由于战略的原因,需要分布在多个地域,例如一个应用需要多个不同地点的服务器提供服务。
分布式系统的各进程之间如何通信?
  • 通过网络进行信息交换。
  • 读写某些共享存储。

网络通信是分布式系统中并发设计的基础。

相关推荐
小白学大数据2 小时前
Scrapy 分布式爬虫:大规模采集汽车之家电车评论
开发语言·分布式·爬虫·scrapy
IvanCodes2 小时前
Zookeeper & Hbase安装教程
大数据·zookeeper·hbase
仗剑_走天涯2 小时前
hadoop reduce阶段 对象重用问题
大数据·hadoop·分布式
电磁脑机3 小时前
无总线场同步:意识本质、AGI困境与脑机革命的核心理论重构
分布式·神经网络·架构·信号处理·agi
半桶水专家3 小时前
kafka数据删除策略详解
分布式·kafka
一个有温度的技术博主3 小时前
Lua语法进阶:函数封装与条件控制的艺术
redis·分布式·缓存·lua
无心水3 小时前
2、5分钟上手|PyPDF2 快速提取PDF文本
java·linux·分布式·后端·python·架构·pdf
Jackyzhe3 小时前
从零学习Kafka:位移与高水位
分布式·学习·kafka
roman_日积跬步-终至千里3 小时前
【系统架构师-案例题-分布式数据缓存架构】22年下(3)分布式仓储货物管理系统
分布式·缓存·系统架构
仗剑_走天涯4 小时前
hadoop 中 yarn node -list 显示0 问题解决
大数据·hadoop·分布式