尚硅谷-Kafka01-介绍-安装-ZK和Broker工具-Kafka系统架构-启动和竞争管理者controller

1.为什么分布式系统之间需要Kafka来完成数据交换?

  • 线程和线程之间的交互是通过共享的堆内存来完成数据交换的

    如果都往堆中放,就会数据大量积压,内存空间是非常宝贵的,不推荐用内存来存储;

  • 进程和进程之间的数据交互

  • Java进程和进程之间的采用消息中间件来解耦合

  • Java中定义了一个规范,JMS

  • P2P 点对点模型:1条消息只能被1个消费者消费到并响应

  • PS 发布订阅模型-用Topic(主题)进行分类,1条消息可以被多个消费者同时消费到并响应

    其他消息中间件

  • kafka的完整流程

  • 为了防止宕机导致数据丢失,会将数据存入磁盘文件,一般叫做xxx.log文件

  • 消息在队列中有个顺序索引,在kafka中叫做偏移量(offset)

  • kafka的安装

  • kafka需要zookeeper进行多节点协调调度

  • 启动zk.cmd

  • 启动kfk.cmd

    2.实操部分

  • 数据的生产是需要主题Topic的,先创建主题Topic

  • 先连接kafka服务器,并创建主题Topic

  • 创建完,查看已有哪些主题Topic

  • 详细查看某一个Topic详细信息

    2.2 有了主题之后就可以进行生产消息了

    2.3 在Java中集成Kafka

  • 引包,配置连接参数,代码获取参数,连接kafka,设置主题,消息,发送,关闭连接

  • 生产者代码

  • 生产者发送多条消息

  • 消费者代码

  • 消费者多次消费

    代码测试

  1. Kafkatool工具来操作Kafka
  • 启动zk和kafka
  • 添加Topic
  • 添加数据

  • 通过Gradle可以看源码,JDK17+Scala插件 打开源码文件

Kafka的系统架构

  • 单个Kafka服务很容易出现性能瓶颈和高可用问题
  • 采用集群部署,每个Kafka的Broker中都有同一个Topic
  • 如何消费同一个主题Topic下不同分区的消息?

  • 正常来说1个Topic是一个整体,现在却被划分到不同的broker的partition中,将partition编号,0-1-2-3
  • 消费的时候,订阅1个Topic,这个Topic的partition分散在不同的Broker中,消费的时候不可能只消费某个broker,而是全部Topic,无论在哪个Broker中都要能消费到。
  • 所以消费的时候,要将消费同一个Topic的多个消费者组成1个消费者组(整体)
  • 如果某个Broker宕机,那对应的partition的消息就无法消费了,所以要有个备份,保证其中一个宕机,也能消费到那个宕机的Broker的消息
  • 采用不同Broker之间互相备份,保证高可用
  • 副本的概念(就是备份),不同的Broker互相存副本

  • 一旦Master宕机,靠Zookeeper重新选举
  • Kafka集群图

Zookeeper的核心功能

  • 持久化节点,Kafka切断连接后,Zookeeper中的Znode节点依然会保留
  • 临时节点,,Kafka切断连接后,Zookeeper中的Znode节点会消失
  • Broker启动后Zookeeper节点的变化
  • 通过prettyZoo
  • 未启用节点
  • 启动Kafka节点之后
  • 启动3个节点,只在Brokers里增加了
  • 而Controller没有变化,只有一个

Zookeeper选举的过程

  • Controller选举过程详解
  1. Zookeeper中没有任何节点,此时启动第一个Broker,ZK当中创建第一个节点,id=1;成为集群的管理者;
  2. ZK有节点1了,启动Broker2,ZK当中创建第2个节点,id=2;
  3. ZK有节点1和2了,启动Broker3,ZK当中创建第3个节点,id=3;
    一旦Broker1宕机,Broker2和Broker3就会竞争,成功者会成为集群的管理者;
  • 第一个Broker启动的流程
  • 第二个Broker启动的流程
  • 第三个Broker启动的流程
  • controller节点如果被删除的情况

启动服务器底层实现

  • Broker和ZK之间的通信


相关推荐
indexsunny2 小时前
互联网大厂Java面试实战:Spring Boot微服务在电商场景中的应用与挑战
java·spring boot·redis·微服务·kafka·spring security·电商
TTBIGDATA2 小时前
【Atlas】Ambari 中 开启 Kerberos + Ranger 后 Atlas Hook 无权限访问 Kafka Topic:ATLAS_HOOK
大数据·kafka·ambari·linq·ranger·knox·bigtop
Coder_Boy_3 小时前
基于SpringAI的在线考试系统-相关技术栈(分布式场景下事件机制)
java·spring boot·分布式·ddd
C澒5 小时前
前端整洁架构(Clean Architecture)实战解析:从理论到 Todo 项目落地
前端·架构·系统架构·前端框架
程序员泠零澪回家种桔子5 小时前
分布式事务核心解析与实战方案
分布式
C澒5 小时前
前端分层架构实战:DDD 与 Clean Architecture 在大型业务系统中的落地路径与项目实践
前端·架构·系统架构·前端框架
凯子坚持 c6 小时前
CANN 生态中的分布式训练利器:深入 `collective-ops` 项目实现高效多卡协同
分布式
岁岁种桃花儿6 小时前
Kafka从入门到上天系列第一篇:kafka的安装和启动
大数据·中间件·kafka
惊讶的猫7 小时前
rabbitmq实践小案例
分布式·rabbitmq
禁默8 小时前
打破集群通信“内存墙”:手把手教你用 CANN SHMEM 重构 AIGC 分布式算子
分布式·重构·aigc