【Kafka笔记】(一)认识 Kafka

一、什么是 Kafka

Kafka 是一款分布式、高吞吐、低延迟、持久化的消息队列/流处理平台。通俗的讲Kafka 就是一个"实时数据中转站+数据蓄水池"

  • 上游业务/设备产生数据 → 发给 Kafka 存起来

  • 下游 Flink、服务、数仓 → 从 Kafka 实时拉取数据计算

二、为什么大数据实时开发必须用 Kafka

如果没有 Kafka:

  • 业务系统直接调用计算服务,流量暴涨会直接打崩服务

  • 数据瞬时峰值过高,程序处理不过来导致丢失数据

  • 无法解耦生产端和消费端

有了 Kafka:

  • 削峰填谷:瞬时海量数据先缓存,下游慢慢消费

  • 解耦:生产者只管发,消费者只管读,互不影响

  • 持久化:数据落盘,不会丢失,支持回溯消费

  • 高吞吐:支撑百万级 QPS,车联网、日志、实时数据首选

三、应用场景

1. 实时数据传输

车联网、物联网设备实时上报数据

2. 实时计算

配合 Flink 做实时清洗、统计、告警

3. 日志收集

系统日志、操作日志实时采集

4. 业务解耦

订单、支付、消息推送异步处理

5. 数据同步

实时同步数据库、数仓数据

相关推荐
阿里云云原生3 天前
数据链路再精简:Kafka 如何做到“零 ETL”一键写入 Apache Iceberg?
kafka
RainCity3 天前
Java Swing 自定义组件库分享(十二)
java·笔记·后端
阿里云云原生9 天前
告别冗长链路!Kafka × Table Bucket 实现开放表格式零 ETL 实时入湖
云原生·kafka
LinXunFeng10 天前
Obsidian - 使用 Share Note 分享笔记并自部署
前端·笔记·github
闪闪发亮的小星星15 天前
高斯光以及高斯光公式解释
笔记
cqbzcsq15 天前
CellFlow虚拟细胞论文阅读
论文阅读·人工智能·笔记·学习·生物信息
阿米亚波15 天前
【Windows】QEMU 启动 openEuler aarch64/arm64 架构系统 + 离线软件源
linux·windows·经验分享·笔记·架构·arm
自传.15 天前
尚硅谷 Vibe Coding|第三章(1) Claude Code深度使用与进阶技巧 学习笔记
笔记·学习·尚硅谷·vibecoding
.千余15 天前
【C++】模板进阶全解:非类型参数|全特化|偏特化|分离编译完全指南
开发语言·c++·笔记·学习·其他
自传.15 天前
尚硅谷 Vibe Coding|第二章 AI编程工具生态 学习笔记
笔记·学习·ai编程·尚硅谷·vibe coding