# Kafka组件化及拓展

1.Kafka

Kafka是一个开源的分布式事件流处理平台。主要用于构建实时数据管道和流处理应用程序,广泛用于日志采集。Kafka具有高吞吐量、高可用性、持久化存储、可拓展性等特点。因为公司项目中消息中间件都是用的Kafka,而且也发现在使用时有一些亮点和设计,所以想展开整理记录下,希望给有想使用Kafka作为中间件的朋友一些帮助。

2.Kafka怎么保证消息的可靠性

这里讲的可靠性主要是针对发布时的可靠性,这也是消息可靠性(发布、持久化、消费)最重要的一环,实现思路的话也很简单,简单描述就是支持发布可重试,实现如下:

  • 数据库中增加一张kafka_message表,在发布消息时先插入消息到kafka_message表
  • 增加一个定时任务,不断查询kafka_message表,遍历发布消息到kafka,然后再从kafka_message表删除发布成功的记录

另外消费时可靠性主要靠消费机制保证MessageDeliverySemantics=AT_LEAST_ONCE

3.Kafka组件化及多集群消息消费实现

a.组件化

组件指的是软件系统中的独立单元。因为Kafka本身已经算是一个消息组件,我在此处指的是通过将kafka、redis等中间件抽象成:组件类型、组件名称,通过这两个概念可以拿到该组件的一个集群地址去使用,在后面的内容中也会使用这种概念。

b. 多集群消息消费实现

  • 一些抽象类及枚举:

    • AbstractEventProcessor,消费者

      复制代码
      protected abstract void process(String msg); //消费消息实现
      
      public abstract int runners();  //消费者数量
      
      public abstract KafkaTopic topic();  //消费的主题
    • IConsumerGroupContext ,消费者组上下文接口,抽象了同一类消费者

      复制代码
      Properties getConsumerProperties();//单次拉取消息条数、序列化工具类、反序列化工具类
      
      Class<? extends AbstractEventProcessor> getProcessorClass(); //获取消息处理类
      
      MessageDeliverySemantics getDeliverySemantics(); //消费重试机制
      
      KafkaTopic getTopic(); //消息主题
       
      String getBootstrapServers();  //连接地址
    • KafkaClusterType : Kafka集群枚举,会配置成跟一个组件名对应的形式如

      复制代码
      {"TEST":"Kafka1","TESTNEW":"Kafka2"}
    • KafkaTopic,主题枚举,例如

      复制代码
      TEST_TOPIC("test", "测试topic", KafkaClusterType.TEST)
    • ConsumerRunnerPoolConfig,消费者线程池配置,包含Topic、processor、runner(消费者数量)

    • ConsumerRunnerPool, 消费者线程池类

  • 消费者启动的大概流程

    • 读取需要消费的Topic

    • 根据Topic 获取过滤获得对应的IConsumerGroupContext类,contextList

    • 遍历contextList,context

      • 根据context填充ConsumerRunnerPoolConfig

      • 再根据ConsumerRunnerPoolConfig去启动ConsumerRunnerPool

        核心线程池和最大线程池都是消费者数量,可以通过硬编码/配置

整体思路比较简单,但是抽象支持集群和组件配置后,可以支持集群切换或多集群,这对于灵活应对Kafka集群的切换和灾备是很有意义的。

相关推荐
Francek Chen1 小时前
【大数据处理与分析】MapReduce:05 MapReduce的具体应用
大数据·hadoop·分布式·mapreduce
我是一颗柠檬2 小时前
【Java项目技术亮点】分布式锁实现与优化:从Redisson到ZooKeeper,彻底搞懂分布式锁的底层原理
java·redis·分布式·中间件·java-zookeeper
moonsims3 小时前
基于Lattice Mesh的AI 的分布式共识与动态任务分配架构的无人机群“去中心化无声协同”技术和极低带宽下的韧性通信技术
人工智能·分布式·架构
一个骇客4 小时前
批处理模型详解:从 MapReduce 到数据流引擎
分布式·架构
todoitbo5 小时前
Agent_Swarm_分布式协作的通信编排与节点发现机制分析
人工智能·分布式·ai·jiuwenswarm
Ze3G90nYt5 小时前
Redis 分布式锁进阶第一百二十篇
数据库·redis·分布式
段一凡-华北理工大学5 小时前
工业领域的Hadoop架构学习~系列文章19:能源行业Hadoop应用实践
大数据·人工智能·hadoop·分布式·学习·架构·高炉炼铁
giaz14n9X16 小时前
Redis 分布式锁进阶第五十七篇
数据库·redis·分布式
WyCAGy8ij17 小时前
Redis 分布式锁进阶第二篇讲解
数据库·redis·分布式
冰西瓜60019 小时前
深度学习的数学原理(四十二)—— 分布式训练
人工智能·分布式·深度学习