Kafka - 技术栈

Kafka

-南柯一梦2024-05-27 17:04

Kafka是一个分布式流处理平台，主要用于构建实时数据管道和流应用程序。它可以看作是一个消息队列服务，但与传统消息队列相比，具有更高的吞吐量、更好的可扩展性和持久性。

支持大规模的消息处理，确保消息的持久化和顺序性

为了通俗地理解Kafka，我们可以把它比作一个"大型的广播电台"，

生产者（Producers）：生产者就是信息的发布者 ，比如新闻主播。在Kafka中，生产者是指那些发布消息到Kafka队列的应用程序或系统。
Kafka集群（Kafka Cluster）：这相当于广播电台的设施，包括发射塔、控制室等。Kafka集群由多个服务器组成，这些服务器协同工作，存储消息并对消费者提供服务。
消费者（Consumers）：消费者就是听众，也是信息的接收者。在Kafka中，消费者是指那些从Kafka队列中读取消息的应用程序或系统。
消息（Messages）：就是广播电台播放的内容 。在Kafka中，消息是由生产者发布，消费者读取的数据单元。
主题（Topics）：可以理解为广播电台的不同频道 。在Kafka中，消息被分类存储在不同的主题中，生产者和消费者都是针对特定主题进行操作的。
分区（Partitions）：类似于广播电台的不同直播间 。一个主题可以有多个分区 ，不同的分区可以分布在Kafka集群的不同服务器上，以提高系统的吞吐量和可用性。