Kafka

Kafka是一个分布式流处理平台,主要用于构建实时数据管道和流应用程序。它可以看作是一个消息队列服务,但与传统消息队列相比,具有更高的吞吐量、更好的可扩展性和持久性。

支持大规模的消息处理,确保消息的持久化和顺序性

为了通俗地理解Kafka,我们可以把它比作一个"大型的广播电台",

  1. 生产者(Producers):生产者就是信息的发布者 ,比如新闻主播。在Kafka中,生产者是指那些发布消息到Kafka队列的应用程序或系统

  2. Kafka集群(Kafka Cluster):这相当于广播电台的设施,包括发射塔、控制室等。Kafka集群由多个服务器组成,这些服务器协同工作,存储消息并对消费者提供服务。

  3. 消费者(Consumers):消费者就是听众,也是信息的接收者。在Kafka中,消费者是指那些从Kafka队列中读取消息的应用程序或系统。

  4. 消息(Messages):就是广播电台播放的内容 。在Kafka中,消息是由生产者发布,消费者读取的数据单元

  5. 主题(Topics):可以理解为广播电台的不同频道 。在Kafka中,消息被分类存储在不同的主题中,生产者和消费者都是针对特定主题进行操作的。

  6. 分区(Partitions):类似于广播电台的不同直播间一个主题可以有多个分区 ,不同的分区可以分布在Kafka集群的不同服务器上,以提高系统的吞吐量和可用性。

相关推荐
User_芊芊君子3 分钟前
【分布式训练】CANN SHMEM跨设备内存通信库:构建高效多机多卡训练的关键组件
分布式·深度学习·神经网络·wpf
酷酷的崽79824 分钟前
CANN 开源生态解析(四):`cann-dist-train` —— 构建高效可扩展的分布式训练引擎
分布式·开源
惊讶的猫1 小时前
AMQP 与 RabbitMQ 四大模型
分布式·rabbitmq
灰子学技术1 小时前
istio从0到1:如何解决分布式配置同步问题
分布式·云原生·istio
小马爱打代码2 小时前
ZooKeeper:入门实战
分布式·zookeeper·云原生
永远都不秃头的程序员(互关)3 小时前
CANN赋能AIGC分布式训练:硬核通信,加速大模型智能生成新纪元
分布式·aigc
杜子不疼.4 小时前
CANN集合通信库HCCL的大规模分布式训练通信优化与拓扑感知实践
分布式
ALex_zry16 小时前
Redis Cluster 分布式缓存架构设计与实践
redis·分布式·缓存
为什么不问问神奇的海螺呢丶18 小时前
n9e categraf rabbitmq监控配置
分布式·rabbitmq·ruby
TTBIGDATA1 天前
【Atlas】Atlas Hook 消费 Kafka 报错:GroupAuthorizationException
hadoop·分布式·kafka·ambari·hdp·linq·ranger