Kafka

KAFKA

kafka集群

  • broker

    • kafka集群运行后,每台服务器上的kafka称为一个broker节点

    • 处理消费者和生成者的请求

      • 生产者需要保存数据到kafka,就需要请求broker
      • 消费者需要从kafka中获取数据,也需要请求broker
    • 多个broker会选取产生一个控制器, 类似zk中 leader角色

      • 管理broker,监控broker的变化
      • 参与分区副本的领导者选举
      • 处理消费者和生成者的请求
      • 有zk从broker中选举出控制器
        • 本质哪台服务器先启动了kafka,生成了broker节点,该节点就作为控制器
  • 主题 Topic

    • kakfa是对消息数据的处理
    • 消息数据会有不同的分类 用户数据 商品数据 订单数据
    • 使用主题对消息数据进行分类,然后分别存储
    • 主题创建成功后,会将主题信息写入zk中,所有的broker就可以从zk获取有哪些主题
    • 生产者写入数据是可以指定写入的主题,人为对数据按照主题分类
    • 消费者读取数据是也要指定主题,从对应的主题下获取数据
    • 操作kafka必须现有主题
  • 分区(分片) Partition

    • 分区是kafka存储数据的最小单元,消息数据最终是存储在分区上的
    • 一个主题在存储时可以指定多个分区
    • 当有多个分区时,分区被分配到不同broker上
    • 分区所存储的数据是在系统的磁盘上进行存储。每个分区会创建不同目录,然后将数据写入该目录下的文件中
    • 文件中存储的数据是有有效期,默认的有效期是168小时,也就是一周,超过有效期后,会删除数据
  • 副本 Replication

    • 为了保证分区数据的安全性,避免分区数据丢失,kafka采用副本机制将分区数据存储多份
    • 默认在创建主题时,如果没有指定副本,那么副本的数量为1,也就是只有一个分区只有一份数据
    • 在创建主题时,可以指定多个副本,一般指定副本数量是2-3个
    • 副本数据不会保存在同一台服务器上,会将副本保存在多台服务器,通过轮循broker节点,创建副本
    • 多副本的角色划分
      • 领导者副本
        • broker控制器会选举产生一个领导者副本
        • 领导者副本负责处理所有请求(写入和读取)
        • 生产者写入数据是,会将数据给到领导者副本,领导者副本写完后,会将数据同步给追随者副本
      • 追随者副本
        • 追随者副本 请求领导者本副本获取最新数据,如果领导者副本有新数据产生,会将新数据同步给追随者副本
        • 追随者副本不处理数据的写入和读取请求
  • 偏移量(offset)

    • 分区数据在存储的时候会有一个偏移量,记录了数据在分区中的位置。
    • 保证在同一个分区内的数据是有序存储的,可以保证数据的顺序性,消费在读取数据进行处理就是按照偏移量位置顺序读取数据处理
相关推荐
踩坑小念4 小时前
秒杀场景下如何处理redis扣除状态不一致问题
数据库·redis·分布式·缓存·秒杀
yumgpkpm6 小时前
2026软件:白嫖,开源,外包,招标,晚进场(2025年下半年),数科,AI...中国的企业软件产业出路
大数据·人工智能·hadoop·算法·kafka·开源·cloudera
笃行客从不躺平8 小时前
Token 复习
java·分布式·spring cloud
u01040583610 小时前
分布式淘客系统的配置中心设计:Nacos在多环境配置管理的应用
分布式
迎仔11 小时前
01-Hadoop 核心三剑客通俗指南:从“单机搬砖”到“包工队”
大数据·hadoop·分布式
ALex_zry11 小时前
分布式缓存与微服务架构的集成
分布式·缓存·架构
ALex_zry12 小时前
分布式缓存安全最佳实践
分布式·安全·缓存
陌上丨15 小时前
分布式锁的特性是什么?如何实现分布式锁?
分布式
yangSnowy15 小时前
MySQL 分布式锁实现方案
数据库·分布式·mysql
ALex_zry15 小时前
分布式缓存性能优化策略
分布式·缓存·性能优化