阶段 1:Kafka基础认知

核心知识点

  1. Kafka 三大核心角色:

    • Producer(生产者) :负责向 Kafka topic 推送数据。可以理解为数据流的发起者。
    • Broker:Kafka 服务器节点,负责存储数据流。Kafka 集群由多个 broker 组成。
    • Consumer(消费者) :负责从 Kafka topic 中读取和处理数据,可以是日志分析服务、数据库服务器等。
  2. 核心概念:

    • Topic:Kafka 的基本单元,类似于数据库的表结构,用于对数据进行分类。
    • Partition:每个 topic 可以细分为多个 partition。每个 partition 是一个有序的不可变的记录序列,并且不断追加到此结构中。
    • Offset:Kafka 不同于传统差的消息队列的一点就是,它会给每条消息分配一个 offset(偏移量),在 consumer 端用来追踪消费者的读取记录。
    • Consumer Group(消费组) :组中的每个 consumer 是相互独立地消费分配给自己的 partition。不同消费组可以独立消费消息。
典型场景
  • 实时日志流处理:分析网站点击流,通过 Kafka 传输并处理实时用户数据信息。
  • 物联网设备数据采集:设备数据通过 Kafka 实时推送到后台服务器进行分析处理。
  • 微服务间异步通信:简化服务之间的通信,减少同步调用带来的复杂性。
  • 金融交易实时风控:收集交易数据实时分析,检测异常行为。
相关推荐
小镇敲码人4 分钟前
华为CANN框架中HCCL仓库的全面解析:分布式通信的引擎
分布式·华为
User_芊芊君子36 分钟前
【分布式训练】CANN SHMEM跨设备内存通信库:构建高效多机多卡训练的关键组件
分布式·深度学习·神经网络·wpf
酷酷的崽7981 小时前
CANN 开源生态解析(四):`cann-dist-train` —— 构建高效可扩展的分布式训练引擎
分布式·开源
惊讶的猫2 小时前
AMQP 与 RabbitMQ 四大模型
分布式·rabbitmq
灰子学技术2 小时前
istio从0到1:如何解决分布式配置同步问题
分布式·云原生·istio
小马爱打代码2 小时前
ZooKeeper:入门实战
分布式·zookeeper·云原生
永远都不秃头的程序员(互关)3 小时前
CANN赋能AIGC分布式训练:硬核通信,加速大模型智能生成新纪元
分布式·aigc
杜子不疼.4 小时前
CANN集合通信库HCCL的大规模分布式训练通信优化与拓扑感知实践
分布式
ALex_zry17 小时前
Redis Cluster 分布式缓存架构设计与实践
redis·分布式·缓存
为什么不问问神奇的海螺呢丶19 小时前
n9e categraf rabbitmq监控配置
分布式·rabbitmq·ruby