阶段 1:Kafka基础认知

核心知识点

  1. Kafka 三大核心角色:

    • Producer(生产者) :负责向 Kafka topic 推送数据。可以理解为数据流的发起者。
    • Broker:Kafka 服务器节点,负责存储数据流。Kafka 集群由多个 broker 组成。
    • Consumer(消费者) :负责从 Kafka topic 中读取和处理数据,可以是日志分析服务、数据库服务器等。
  2. 核心概念:

    • Topic:Kafka 的基本单元,类似于数据库的表结构,用于对数据进行分类。
    • Partition:每个 topic 可以细分为多个 partition。每个 partition 是一个有序的不可变的记录序列,并且不断追加到此结构中。
    • Offset:Kafka 不同于传统差的消息队列的一点就是,它会给每条消息分配一个 offset(偏移量),在 consumer 端用来追踪消费者的读取记录。
    • Consumer Group(消费组) :组中的每个 consumer 是相互独立地消费分配给自己的 partition。不同消费组可以独立消费消息。
典型场景
  • 实时日志流处理:分析网站点击流,通过 Kafka 传输并处理实时用户数据信息。
  • 物联网设备数据采集:设备数据通过 Kafka 实时推送到后台服务器进行分析处理。
  • 微服务间异步通信:简化服务之间的通信,减少同步调用带来的复杂性。
  • 金融交易实时风控:收集交易数据实时分析,检测异常行为。
相关推荐
露天赏雪3 小时前
Java 高并发编程实战:从线程池到分布式锁,解决生产环境并发问题
java·开发语言·spring boot·分布式·后端·mysql
susu10830189115 小时前
docker启动kafka
docker·容器·kafka
没有bug.的程序员5 小时前
Spring Boot 事务管理:@Transactional 失效场景、底层内幕与分布式补偿实战终极指南
java·spring boot·分布式·后端·transactional·失效场景·底层内幕
LuminescenceJ5 小时前
GoEdge 开源CDN 架构设计与工作原理分析
分布式·后端·网络协议·网络安全·rpc·开源·信息与通信
组合缺一9 小时前
论 AI Skills 分布式发展的必然性:从单体智能到“云端大脑”的跃迁
java·人工智能·分布式·llm·mcp·skills
麦兜*10 小时前
深入解析云原生时代的高性能消息中间件:基于Apache Pulsar与Kafka架构对比的万亿级数据吞吐与低延迟实时处理实战
云原生·kafka·apache
shepherd12610 小时前
深度剖析SkyWalking:从内核原理到生产级全链路监控实战
分布式·后端·skywalking
DolphinScheduler社区10 小时前
Linux 环境下,Apache DolphinScheduler 如何驱动 Flink 消费 Kafka 数据?
linux·flink·kafka·开源·apache·海豚调度·大数据工作流调度
h7ml12 小时前
基于 RabbitMQ 构建异步化淘客订单处理流水线:解耦、削峰与失败重试
分布式·rabbitmq·ruby
夜月蓝汐12 小时前
分布式监控SkyWalking链路追踪
分布式·skywalking