【Kafka笔记】(一)认识 Kafka

一、什么是 Kafka

Kafka 是一款分布式、高吞吐、低延迟、持久化的消息队列/流处理平台。通俗的讲Kafka 就是一个"实时数据中转站+数据蓄水池"

  • 上游业务/设备产生数据 → 发给 Kafka 存起来

  • 下游 Flink、服务、数仓 → 从 Kafka 实时拉取数据计算

二、为什么大数据实时开发必须用 Kafka

如果没有 Kafka:

  • 业务系统直接调用计算服务,流量暴涨会直接打崩服务

  • 数据瞬时峰值过高,程序处理不过来导致丢失数据

  • 无法解耦生产端和消费端

有了 Kafka:

  • 削峰填谷:瞬时海量数据先缓存,下游慢慢消费

  • 解耦:生产者只管发,消费者只管读,互不影响

  • 持久化:数据落盘,不会丢失,支持回溯消费

  • 高吞吐:支撑百万级 QPS,车联网、日志、实时数据首选

三、应用场景

1. 实时数据传输

车联网、物联网设备实时上报数据

2. 实时计算

配合 Flink 做实时清洗、统计、告警

3. 日志收集

系统日志、操作日志实时采集

4. 业务解耦

订单、支付、消息推送异步处理

5. 数据同步

实时同步数据库、数仓数据

相关推荐
xuhaoyu_cpp_java3 小时前
项目学习(三)分页查询
java·经验分享·笔记·学习
闪电悠米5 小时前
黑马点评-Redis 消息队列-03_stream_consumer_group
开发语言·数据库·redis·分布式·缓存·junit·lua
Cloud_Shy6187 小时前
解读《Effective Python 3rd Edition》:从练气到老魔(第五章 Item 33 - 35)
开发语言·人工智能·笔记·python·学习方法
做cv的小昊7 小时前
计算机图形学:【Games101】学习笔记08——光线追踪(辐射度量学、渲染方程与全局光照、蒙特卡洛积分与路径追踪)
图像处理·笔记·学习·计算机视觉·游戏引擎·图形渲染·概率论
星恒随风7 小时前
C++ 类和对象入门(五):初始化列表、explicit 和 static 成员详解
开发语言·c++·笔记·学习·状态模式
折哥的程序人生 · 物流技术专研7 小时前
《Java 100 天进阶之路》第95篇:消息队列基础(RocketMQ/Kafka)(2026版)
java·面试·kafka·rocketmq·java-rocketmq·求职招聘
z落落9 小时前
C# 事件(Event)+自定义带参数事件例子
开发语言·分布式·c#
彼岸星光ぐ>9 小时前
Windows系统下Kafka KRaft模式配置与启动教程
kafka
我是一颗柠檬10 小时前
【Java项目技术亮点】分库分表+数据路由策略:单表5000万后的架构升级方案
java·开发语言·分布式·架构
伊布拉西莫11 小时前
【流畅的Python】第20章:并发执行器 — 学习笔记
笔记·python·学习