Kafka基础

一、Kafka是什么?

Kafka已经定位成一个分布式流式处理平台,它以高吞吐、可持久化、可水平扩展、支持流数据处理等多种特性而广泛使用。

Kafka主要是三大角色:

消息系统:提供了大多数消息系统难以实现的消息顺序性保障以及回溯消费的功能。

存储系统:Kafka把消息持久化到磁盘相比于其他基于内存存储的系统而言,有效降低了数据丢失的风险。消息持久化的功能和多副本机制。

流式处理平台:完整的流式处理类库。

二、Kafka核心概念

  1. Producer(生产者) : 生产消息的一方。
  2. Consumer(消费者) : 消费消息的一方。
  3. Broker(代理) : 服务代理节点,对于kafka而言,broker可以看作是一个独立的kafka服务节点或kafka服务实例。大多数情况下可以将broker看作一台kafka服务器。

同时,你一定也注意到每个 Broker 中又包含了 Topic 以及 Partition 这两个重要的概念:

  • Topic(主题) : Producer 将消息发送到特定的主题,Consumer 通过订阅特定的 Topic(主题) 来消费消息。主题是逻辑上的概念,它还可以细分为多个Partition。
  • Partition(分区) : Partition 属于 Topic 的一部分。一个 Topic 可以有多个 Partition ,并且同一个 Topic 下的 Partition 可以分布在不同的 Broker 上,这也就表明一个 Topic 可以横跨多个 Broker 。一个Partition只属于单个Topic,同一Topic下的不同Partition包含的消息是不同的,Partition在存储层面可以看作是一个可追加的日志文件,消息在被追加到分区日志文件的时候都会分配一个特定的偏移量(offset) 。offset是消息在Partition中的唯一标识,kafka通过它来保证消息在Partition内的顺序性,不过offset并不跨越分区,也就是说,kafka保证的是分区有序而不是主题有序。
相关推荐
DoraBigHead13 小时前
🧭 React 理念:让时间屈服于 UI —— 从同步到可中断的演化之路
前端·javascript·面试
DTS小夏14 小时前
算法社Python基础入门面试题库(新手版·含答案)
python·算法·面试
沐怡旸15 小时前
【底层机制】std:: function 解决的痛点?是什么?如何实现?如何正确用?
c++·面试
yinke小琪15 小时前
面试官:谈谈为什么要拆分数据库?有哪些方法?
java·后端·面试
南北是北北16 小时前
android从点击图标icon到进入首页的系统调用过程
面试
拉不动的猪16 小时前
从底层逻辑和实用性来分析ref中的值为什么不能直接引用
前端·javascript·面试
编程岁月17 小时前
java面试-0136-BIO、NIO、AIO区别?
java·面试·nio
道可到18 小时前
35 岁程序员的绝地求生计划:你准备好了吗?
前端·后端·面试
道可到18 小时前
国内最难入职的 IT 公司排行:你敢挑战哪一家?
前端·后端·面试
bot55566618 小时前
企业微信iPad协议演进:从私有二进制到可扩展接口
面试