Kafka基础

一、Kafka是什么?

Kafka已经定位成一个分布式流式处理平台,它以高吞吐、可持久化、可水平扩展、支持流数据处理等多种特性而广泛使用。

Kafka主要是三大角色:

消息系统:提供了大多数消息系统难以实现的消息顺序性保障以及回溯消费的功能。

存储系统:Kafka把消息持久化到磁盘相比于其他基于内存存储的系统而言,有效降低了数据丢失的风险。消息持久化的功能和多副本机制。

流式处理平台:完整的流式处理类库。

二、Kafka核心概念

  1. Producer(生产者) : 生产消息的一方。
  2. Consumer(消费者) : 消费消息的一方。
  3. Broker(代理) : 服务代理节点,对于kafka而言,broker可以看作是一个独立的kafka服务节点或kafka服务实例。大多数情况下可以将broker看作一台kafka服务器。

同时,你一定也注意到每个 Broker 中又包含了 Topic 以及 Partition 这两个重要的概念:

  • Topic(主题) : Producer 将消息发送到特定的主题,Consumer 通过订阅特定的 Topic(主题) 来消费消息。主题是逻辑上的概念,它还可以细分为多个Partition。
  • Partition(分区) : Partition 属于 Topic 的一部分。一个 Topic 可以有多个 Partition ,并且同一个 Topic 下的 Partition 可以分布在不同的 Broker 上,这也就表明一个 Topic 可以横跨多个 Broker 。一个Partition只属于单个Topic,同一Topic下的不同Partition包含的消息是不同的,Partition在存储层面可以看作是一个可追加的日志文件,消息在被追加到分区日志文件的时候都会分配一个特定的偏移量(offset) 。offset是消息在Partition中的唯一标识,kafka通过它来保证消息在Partition内的顺序性,不过offset并不跨越分区,也就是说,kafka保证的是分区有序而不是主题有序。
相关推荐
Zik----4 分钟前
操作系统核心考点(面试/期末复习)
面试·操作系统·研究生面试·期末复习专业课计算机
一只叫煤球的猫43 分钟前
别再把 Codex 念成“Code-X”,全错了,AI编程英语发音纠正
人工智能·面试·程序员
童话ing1 小时前
【Redis】026 互联网大厂 Redis 面试高频题
数据库·redis·面试
一叶飘零_sweeeet2 小时前
2026 年 Java 面试必问:Spring AI 核心原理,90% 人答不全
java·面试·spring ai
逻辑驱动的ken3 小时前
Java高频面试考点场景题21
java·开发语言·面试·职场和发展·求职招聘
辛苦才能4 小时前
数据结构--排序--插入排序(C语言,重点排序面试和比赛都会考察)
c语言·数据结构·面试
许彰午17 小时前
我手写了一个 Java 内存数据库(二):B+ 树的插入与分裂
java·开发语言·面试
weisian15121 小时前
基础篇--概念原理-2-参数是什么?——从原理到实战,一篇讲透
面试·职场和发展·模型参数·7b和70b·参数=规则,不是原始数据
AI人工智能+电脑小能手1 天前
【大白话说Java面试题】【Java基础篇】第26题:Java的抽象类和接口有哪些区别
java·开发语言·面试
逻辑驱动的ken1 天前
Java高频面试考点场景题20
java·开发语言·深度学习·面试·职场和发展