kafka

Kafka的优势

Kafka就是一个分布式的用于消息存储的消息队列。一般用于大数据的流式处理中。

一些常见的中间件:ActiveMQ,IBMMQ,RabbitMQ,ZMQ 但都不是分布式的。

Apache Kafka与传统消息系统相比,有以下不同:

它是分布式系统,易于向外扩展。

它同时为发布和订阅提供高吞吐量。

它支持多订阅者,当失败时能自动平衡消费者。

它将消息持久化到磁盘,因此可用于批量消费,允许多个消费者消费数据

Kafka的特性

  1. 高吞吐量、低延迟:kafka每秒可以处理几十万条消息,它的延迟最低只有几毫秒,每个topic可以分多个partition, consumer group 对partition进行consume操作。
    (2)可扩展性:kafka集群支持热扩展。
    (3)持久性、可靠性:消息被持久化到本地磁盘,并且支持数据备份防止数据丢失。
    (4)容错性:允许集群中节点失败(若副本数量为n,则允许n-1个节点失败)。
    (5)高并发:支持数千个客户端同时读写。

  2. 基本概念:Kafka是分布式发布 - 订阅消息系统,由LinkedIn开发后成为Apache项目。它有高吞吐量、可扩展等优势,支持点对点和发布订阅两种消息队列模式。其角色包括Broker、Producer、Consumer等,消息默认保存7天,由Zookeeper管理。安装需先准备JDK和Zookeeper,下载安装包解压、配置并分发到集群节点。

相关推荐
程序_白白5 小时前
RabbitMQ中Consumer的可靠性
分布式·rabbitmq
東雪蓮☆9 小时前
Filebeat+Kafka+ELK 日志采集实战
分布式·elk·kafka
努力买辣条10 小时前
KafKa概念与安装
分布式·kafka
不太可爱的叶某人11 小时前
【学习笔记】kafka权威指南——第8章 跨集群数据镜像(7-10章只做了解)
笔记·学习·kafka
Lansonli13 小时前
大数据Spark(六十七):Transformation转换算子distinct和mapValues
大数据·分布式·spark
失散1318 小时前
分布式专题——35 Netty的使用和常用组件辨析
java·分布式·架构·netty
奔跑吧邓邓子19 小时前
【C++实战(78)】解锁C++ 大数据处理:从并行到分布式实战
c++·分布式·实战·并发·大数据处理
Jolie_Liang19 小时前
证券业智能化投研与分布式交易系统架构:全球发展现状、技术创新与未来趋势研究
分布式·系统架构
2301_7720935620 小时前
tuchuang_myfiles&&share文件列表_共享文件
大数据·前端·javascript·数据库·redis·分布式·缓存
gsfl1 天前
Redis分布式锁
数据库·redis·分布式