Kafka(消息队列)--简介

1、kafka:

是一个高吞吐的分布式消息系统,与Hdfs比较相似,但是与hdfs的区别是在于hdfs是存储的是历史的、海量的数据,然而kafka存储的是实时的、最新的数据。

2、消息队列:

指的是在Kafka中的数据队列。可以存放数据在峰值的时候的数据,因为在数据峰值的时候,此时的数据量比较大,对于消费者没有办法及时的消费,为了防止反压的现象,此时的数据就可以在消息队列中等待。

生产者:生产者负责产生数据

消费者:消费者负责消费数据

3、消息队列的一般的应用场景:系统之间的解耦合、峰值压力缓冲、异步通信

峰值压力缓冲的应用在Flink中:

当数据某一时刻的产生的速度要是大于Flink的处理的速度,可以通过提高并行度来增加数据处理的速度,但是Flink是7*24小时的工作机制,就会导致资源的浪费,此时可以通过kafka来做峰值压力缓冲,就是在Flink高峰期的时候,将没办法及时处理的数据缓存在队列中,减轻Flink的压力。

4、Kafka的特点:

1、消息系统的模型:生存者消费者模型,FIFO模型

2、高性能:单节点支持上千个客户端

3、持久性:消息直接持久化在磁盘上且性能比较好

4、分布式:数据副本冗余,流量负载均衡,可扩展

5、很灵活:消息长时间持久化+client维护消费状态

5、kafka性能比较好的原因:

1、kafka写磁盘是顺序写的

2、采用了sendFile的0拷贝的技术,提高速度

3、还采用了批量写入,一批一批的写入数据,64k为一个单位。

6、kafka集群:

1、组件:

1、broker:使用存放数据的,也是多节点的

2、Zookeeper:负责存储kafka的元数据

相关推荐
WHFENGHE6 小时前
输电线路分布式故障监测装置技术解析
分布式
nightunderblackcat7 小时前
新手向:实现验证码程序
java·spring boot·spring·java-ee·kafka·maven·intellij-idea
a587698 小时前
消息队列(MQ)高级特性深度剖析:详解RabbitMQ与Kafka
java·分布式·面试·kafka·rabbitmq·linq
hmb↑8 小时前
Kafka 3.9.x 安装、鉴权、配置详解
分布式·kafka·linq
java干货8 小时前
还在重启应用改 Topic?Spring Boot 动态 Kafka 消费的“终极形态”
spring boot·kafka·linq
lifallen8 小时前
KafkaStreams 计算图节点设计:ProcessorNode、SourceNode、SinkNode
java·数据结构·算法·kafka·apache
AAA修煤气灶刘哥9 小时前
缓存世界的三座大山:穿透、击穿、雪崩,今天就把它们铲平!
redis·分布式·后端
失散1310 小时前
分布式专题——4 大厂生产级Redis高并发分布式锁实战
java·redis·分布式·缓存·架构
eqwaak011 小时前
科技信息差(9.10)
网络·人工智能·分布式·ar·智能硬件
一个帅气昵称啊11 小时前
C#,RabbitMQ从入门到精通,.NET8.0(路由/分布式/主题/消费重复问题 /延迟队列和死信队列/消息持久化 )/RabbitMQ集群模式
分布式·微服务·架构·rabbitmq·.net