Zookeeper与Kafka学习笔记

一、Zookeeper核心要点

1. 核心特性

分布式协调服务,用于维护配置/命名/同步等元数据

采用层次化数据模型(Znode树结构),每个节点可存储<1MB数据

典型应用场景:

Hadoop NameNode高可用

HBase元数据管理

Kafka集群选举与状态管理

2. 设计限制

内存型存储,不适合大数据量场景

数据变更通过版本号(Version)控制,实现乐观锁机制

采用ZAB协议保证数据一致性

二、Kafka核心架构

1. 三大核心角色

消息系统:解耦/削峰/异步通信,支持顺序性与回溯消费

存储系统:持久化存储+多副本机制,数据保留策略可配置

流处理平台:提供窗口/连接/聚合等实时处理能力

2. 核心组件

|----------|----------------------------|
| 组件 | 功能说明 |
| Producer | 消息生产者,支持自动负载均衡/指定分区写入 |
| Broker | 服务节点,负责消息持久化存储与副本同步 |
| Consumer | 采用Pull模式消费,记录offset保证消费连续性 |

3. 核心机制

主题与分区

Topic逻辑分类,Partition物理分片(提升并发能力)

单Partition内消息有序,不同Partition间无序

多副本机制

Leader处理读写,Follower同步数据

ISR(In-Sync Replicas)机制保障高可用

三、Zookeeper与Kafka协同

集群管理:记录Broker注册信息与存活状态

元数据存储

存储Topic配置、Partition分配方案

维护Consumer Group的offset信息(旧版本)

选举机制

Controller选举(集群主节点)

Partition Leader选举

四、消息存储与消费

1. 存储设计

分区对应物理日志文件(Segment分段存储)

索引文件采用稀疏存储,节省空间

消息按时间/大小策略清理旧数据

2. 消费模式

|--------|-----------------|
| 模式 | 特点 |
| 点对点 | 单消费组单消费者 |
| 发布-订阅 | 多消费组独立消费 |
| 高效消费配置 | 消费者数=分区数实现最大并行度 |

五、常用命令速查

1. Topic管理

复制代码
bash# 创建主题(4分区2副本)
kafka-topics.sh --create --bootstrap-server localhost:9092 \
--topic my-topic --partitions 4 --replication-factor 2

# 查看主题详情
kafka-topics.sh --describe --bootstrap-server localhost:9092 --topic my-topic

2. 生产消费

复制代码
bash# 控制台生产者(带Key发送)
kafka-console-producer.sh --bootstrap-server localhost:9092 \
--topic my-topic --property parse.key=true --property key.separator=":"

# 控制台消费者(显示元数据)
kafka-console-consumer.sh --bootstrap-server localhost:9092 \
--topic my-topic --property print.partition=true --property print.offset=true

3. 集群管理

复制代码
bash# 查看Broker状态
kafka-cluster.sh --bootstrap-server localhost:9092 --describe

# 修改集群配置
kafka-configs.sh --bootstrap-server localhost:9092 --entity-type brokers \
--entity-name 0 --alter --add-config "log.retention.hours=168"

六、部署要点

环境要求:JDK8+、Zookeeper集群(建议3/5节点)

推荐工具:Kafka-UI进行可视化监控

性能调优方向:

分区数规划

副本因子设置

消息保留策略

压缩算法选择(gzip/lz4等)

相关推荐
go546315846523 分钟前
基于分组规则的Excel数据分组优化系统设计与实现
人工智能·学习·生成对抗网络·数学建模·语音识别
●VON40 分钟前
重生之我在暑假学习微服务第二天《MybatisPlus-下篇》
java·学习·微服务·架构·mybatis-plus
Yu_Lijing1 小时前
MySQL进阶学习与初阶复习第四天
数据库·学习·mysql
好学且牛逼的马2 小时前
学习随笔录
学习
我爱学嵌入式3 小时前
C语言第 9 天学习笔记:数组(二维数组与字符数组)
c语言·笔记·学习
码字的字节6 小时前
ZooKeeper在Hadoop中的协同应用:从NameNode选主到分布式锁实现
hadoop·分布式·zookeeper·分布式锁
im_AMBER7 小时前
学习日志19 python
python·学习
_Kayo_11 小时前
VUE2 学习笔记6 vue数据监测原理
vue.js·笔记·学习
chenchihwen11 小时前
大模型应用班-第2课 DeepSeek使用与提示词工程课程重点 学习ollama 安装 用deepseek-r1:1.5b 分析PDF 内容
人工智能·学习
超浪的晨11 小时前
Java UDP 通信详解:从基础到实战,彻底掌握无连接网络编程
java·开发语言·后端·学习·个人开发