Kafka

官页
 官网文档
 官下载页
 Kafka core apis
Kafka史上最详细原理总结上

Kafka 是由Apache软件基金会开发的一个开源流处理平台, 由Scala和Java编写. Kafka是一种高吞吐量的分布式发布订阅消息系统, 它可以处理消费者在网站中的所有动作流数据. 这种动作（网页浏览, 搜索和其他用户的行动）是在现代网络上的许多社会功能的一个关键因素.

in sort 一个分布式高并发的MQ(消息队列)中间件

核心概念

学什么都是，万变不离其宗，概念先行...

术语	说明
Producer	消息的生成者
Consumer	消息的消费者
ConsumerGroup	消费者组，可以并行消费 Topic 中的 partition 的消息
Broker	代理，Kafka集群中的一台或多台服务器统称 broker。保存主题消息的代理服务器，消费者从这里读取数据（可以理解为一个Kafka服务器节点）
Topic	Kafka处理资源的消息源(feeds of messages)的不同分类
Partition	Topic物理上的分组，一个topic可以分为多个partion，每个partion是一个有序的队列；partion 中每条消息都会被分配一个有序的 Id(offset)
Record	消息，是通信的基本单位，每个producer可以向一个topic（主题）发布一些消息
Producers	消息和数据生成者，向Kafka的一个topic发布消息的过程叫做producers
Consumers	消息和数据的消费者，订阅topic并处理其发布的消费过程叫做consumers

Broker 节点

术语	说明
Leader	分区副本中的"主"副本。每个分区有多个副本，但只有 Leader 负责处理该分区所有的读写请求。
Follower	分区副本中的"备"副本。Follower 不处理客户端请求，只负责从 Leader 同步数据，保持与 Leader 数据一致。
Replica	副本。为了防止数据丢失，分区（Partition）的数据会被复制到多个 Broker 上，这些备份数据称为副本。
Offset	偏移量。每个分区（Partition）中的每条消息都有一个唯一的、有序的 ID，消费者通过它来记录自己读取到了什么位置。
Segment	段（文件）。分区（Partition）在物理上会被进一步细分为多个 Segment 文件（包含 .log 数据文件和 .index 索引文件），便于高效检索和清理旧数据。

Kafka 集群包含一个或多个服务器, 服务器节点称为 broker ;

broker存储topic的数据; 如果某topic有N个partition , 集群有N个broker , 那么每个broker存储该topic的一个partition;

如果某topic有N个partition , 集群有(N+M)个broker , 那么其中有N个broker存储该topic的一个partition, 剩下的M个broker不存储该topic的partition数据; 换言之topic是按partition拆分, 存在broker中的

如果某topic有N个partition , 集群中broker数目少于N个 , 那么一个broker存储该topic的一个或多个partition ; 在实际生产环境中, 尽量避免这种情况的发生, 这种情况容易导致Kafka集群数据不均衡;

另外集群还需要考虑脑裂的问题
简而言之, 主题(topic)包含多个分区(partition) ; Broker是读/写分区(partition)数据的服务器节点, 当然只有leader有写权限, 其他follower同步数据

主题中的分区(partition)

消息: Kafka 中的数据单元被称为消息, 也被称为记录(record), 可以把它看作数据库表中某一行的记录;

批次: 为了提高效率, 消息会分批次写入 Kafka, 批次就代指的是一组消息;

Topic 主题: 消息的种类称为主题（Topic）, 可以说一个主题代表了一类消息; 相当于是对消息进行分类; 主题就像是数据库中的表;

Partition 分区: 主题可以被分为若干个分区（partition）, 同一个主题中的分区可以不在一个机器上, 有可能会部署在多个机器上, 由此来实现 kafka 的伸缩性, 注意: 同一主题中的分区有序, 但是无法保证主题中所有的分区有序

简而言之

**一个主题划分多个分区, 一条消息会以某种(Key和partition机制)规则, 选择其中的一个分区写入, 以提升IO性能 (因此每个分区的消息是不同的)

关于offset: Kafka 通过 offset 保证消息在分区内的顺序, offset 的顺序不跨分区, 因此只保证在同一个分区内的消息是有序的; (除非Topic只有一个分区)

分区可以分布在不同的服务器上, 可以有多个冗灾备份, 通过架构多个服务器节点来实现性能的提升

Partition 和 Broker的数量

1）一个Topic 的 Partition 数量大于等于Broker的数量, 可以提高吞吐率;

2）同一个Partition的Replica尽量分散到不同的机器, 高可用;

当 add a new partition 的时候, partition里面的message不会重新进行分配, 原来的partition里面的message数据不会变, 新加的这个partition刚开始是空的, 随后进入这个topic的message就会重新参与所有partition的load balance

Partition Replica :每个partition可以在其他的kafka broker节点上存副本 , 以便某个kafka broker节点宕机不会影响这个kafka集群

存replica副本的方式是按照kafka broker的顺序存; 例如有5个kafka broker节点, 某个topic有3个partition, 每个partition存2个副本

Kafka 何以高性能?

Kafka的特性之一就是高吞吐率, 但是Kafka的消息是保存或缓存在磁盘上的, 一般认为在磁盘上读写数据是会降低性能的, 但是Kafka即使是普通的服务器, Kafka也可以轻松支持每秒百万级的写入请求, 超过了大部分的消息中间件, 这种特性也使得Kafka在日志处理等海量数据场景广泛应用. Kafka会把收到的消息都写入到硬盘中, 防止丢失数据. 为了优化写入速度Kafka采用了两个技术顺序写入和 sendFile .

一顺序读写

因为硬盘是机械结构, 每次读写都会寻址->写入, 其中寻址是一个"机械动作", 它是最耗时的. 所以硬盘最讨厌随机I/O, 最喜欢顺序I/O. 为了提高读写硬盘的速度, Kafka就是使用顺序I/O. 这样省去了大量的内存开销以及节省了IO寻址的时间. 但是单纯的使用顺序写入, Kafka的写入性能也不可能和内存进行对比, 因此Kafka的数据并不是实时的写入硬盘中 .

Kafka充分利用了现代操作系统分页存储来利用内存提高I/O效率. Memory Mapped Files(后面简称mmap)也称为内存映射文件, 在64位操作系统中一般可以表示20G的数据文件, 它的工作原理是直接利用操作系统的Page实现文件到物理内存的直接映射. 完成MMP映射后, 用户对内存的所有操作会被操作系统自动的刷新到磁盘上, 极大地降低了IO使用率.

二零拷贝

零拷贝是 Kafka 数据高速传输的核心. 它利用操作系统的 sendfile 系统调用, 让数据从磁盘到网卡的过程中, 完全绕过了 Kafka 应用程序本身.

传统方式：数据需要经过"磁盘 → 内核缓冲区 → 用户缓冲区 → Socket缓冲区 → 网卡"的4次拷贝和4次上下文切换, 消耗大量CPU资源.
零拷贝方式：数据直接从内核的页缓存（Page Cache）传输到网卡缓冲区, 仅需2次拷贝和2次上下文切换. 这极大地降低了CPU和内存的开销, 尤其在高并发和多消费者的场景下优势明显.

跟IO中断模式相比, DMA模式下, DMA就是CPU的一个代理, 它负责了一部分的拷贝工作, 从而减轻了CPU的负担. DMA的优点就是：中断少, CPU负担低.

消息流程

生产者定期向主题发送消息;

Kafka代理存储为该特定主题配置的分区中的所有消息; 它确保消息在分区之间平等共享; 如果生产者发送两个消息并且有两个分区, Kafka将在第一分区中存储一个消息, 在第二分区中存储第二消息;

消费者订阅特定主题;

一旦消费者订阅主题 , Kafka将向消费者提供主题的当前偏移 , 并且还将偏移保存在Zookeeper系统中;

消费者将定期请求Kafka(如100 Ms)新消息;

一旦Kafka收到来自生产者的消息, 它将这些消息转发给消费者;

消费者将收到消息并进行处理;

一旦消息被处理, 消费者将向Kafka代理(broker)发送确认;

一旦Kafka收到确认, 它将偏移更改为新值, 并在Zookeeper中更新它; 由于偏移在Zookeeper中维护, 消费者可以正确地读取下一封邮件, 即使在服务器暴力期间;

以上流程将重复, 直到消费者停止请求;

消费者可以随时回退/跳到所需的主题偏移量, 并阅读所有后续消息;

集群的消息传递

消息投递

Kafka生产者在发送完一个的消息之后, 要求Broker (partition leader)在规定的额时间Ack应答, 如果没有在规定时间内应答, Kafka生产者会尝试n次重新发送消息.

Ack应答

acks=1 (默认) - Leader 会将Record写到其本地日志中, 但会在不等待所有Follower的完全确认的情况下做出响应. 在这种情况下; 如果Leader在确认记录后, 但在Follower复制记录之前, 刚好这种情况下就崩了, 则记录数据将丢失了
acks=0 - 生产者根本不会等待服务器的任何确认. 该记录将立即添加到套接字缓冲区中并视为已发送. 在这种情况下, 不能保证服务器已收到记录.
acks=all - 这意味着Leader将等待全套同步副本确认记录. 这种提供了最高的投递可靠性, 但是损伤了性能;

实际使用时, 根据应用特性选择, 绝大多数情况下都会中和可靠性和性能选择第1种

消息在broker上的可靠性 , 因为消息会持久化到磁盘上, 所以如果正常stop一个broker, 其上的数据不会丢失; 但是如果不正常stop, 可能会使存在页面缓存来不及写入磁盘的消息丢失, 这可以通过配置flush页面缓存的周期, 阈值缓解, 但是同样会频繁的写磁盘会影响性能, 又是一个选择题, 根据实际情况配置;

Leader 和选举

每个partition有多个副本 , 其中有且仅有一个作为Leader , Leader是当前负责数据的读写的partition;

Follower跟随Leader, 所有写请求都通过Leader路由, 数据变更会广播给所有Follower,

Follower与Leader保持数据同步;如果Leader失效 , 则从Follower中选举出一个新的Leader ;

当Follower与Leader挂掉, 卡住或者同步太慢, leader会把这个follower从"in sync replicas"（ISR）列表中删除, 重新创建一个Follower;

怎样处理某个Replica不工作的情况?

如果这个部工作的partition replica不在ack列表中(不是partition leader ), 就是producer在发送消息到partition leader上 , partition 的leader再向partition follower发送message没有响应而已, 这个不会影响整个系统, 也不会有什么问题;

如果这个不工作的partition replica 在ack列表中的话(即partition leader ), producer发送的message的时候会等待这个不工作的partition replca写message成功 , 但是会等到time out, 然后返回失败因为某个ack列表中的partition replica没有响应, 此时kafka会自动的把这个部工作的partition replica从ack列表中移除, 以后的producer发送message的时候就不会有这个ack列表下的这个部工作的partition replica了;

Kafka 与 Zookeeper

Kafka 是依赖于 Zookeeper 做集群的

Zookeeper 协调控制

管理broker与consumer的动态加入与离开; (Producer不需要管理, 随便一台计算机都可以作为Producer向Kakfa Broker发消息)

触发负载均衡, 当broker或consumer加入或离开时会触发负载均衡算法 , 使得一个consumer group内的多个consumer的消费负载平衡;

（因为一个 comsumer 消费一个或多个partition, 一个 partition 最终是只能被一个 consumer 消费）

Zookeeper上的细节:

每个broker启动后会在zookeeper上注册一个临时的broker registry, 包含broker的ip地址和端口号, 所存储的topics和partitions信息;

每个consumer group关联一个临时的owner registry和一个持久的offset registry ;

对于被订阅的每个partition包含一个owner registry, 内容为订阅这个partition的consumer id; 同时包含一个offset registry, 内容为上一次订阅的offset;

Quickstart

quickstart
w3c Apache Kafka 教程

Step 1: Download the code

sh 复制代码

tar -xzf kafka_2.12-2.5.0.tgz
cd kafka_2.12-2.5.0

下载->解压里面就已经包含了 Zookeeper了...

sh 复制代码

./config # 配置目录
./bin # 一些操作脚本

Step 2: Start the server

Kafka uses ZooKeeper so you need to first start a ZooKeeper server if you don't already have one. You can use the convenience script packaged with kafka to get a quick-and-dirty single-node ZooKeeper instance.

先启动 zookeeper
bin/zookeeper-server-start.sh config/zookeeper.properties

带 -daemon 参数; 则后台启动

再启动 kafka broker
bin/kafka-server-start.sh config/server.properties

Step 3: Create a topic

bin/kafka-topics.sh --create --bootstrap-server localhost:9092 --replication-factor 1 --partitions 1 --topic test-ka

out 复制代码

Created topic test.

C 复制代码

replication-factor 1 //replication 的数量
partitions //partition 的数量

使用kafka-topics.sh的--describe参数查看一下Topic为kafka的详情

Leader 是指负责这个分区所有读写的节点;

Replicas 是指这个分区所在的所有节点（不论它是否活着）;

ISR 是Replicas的子集, 代表存有这个分区信息而且当前活着的节点;

Step 4: Send some messages

// 启动生产者
bin/kafka-console-producer.sh --bootstrap-server localhost:9092 --topic test

This is a message

This is another message

Step 5: Start a consumer

Kafka also has a command line consumer that will dump out messages to standard output.

//启动消费者
bin/kafka-console-consumer.sh --bootstrap-server localhost:9092 --topic test --from-beginning

This is a message

This is another message

Step 6: Setting up a multi-broker cluster

配置集群

server 配置文件

First we make a config file for each of the brokers (首先为每一个broker 创建配置文件)

//复制2份
cp config/server.properties config/server-1.properties
cp config/server.properties config/server-2.properties

Now edit these new files and set the following properties:

ini 复制代码

config/server-1.properties:
    broker.id=1
    listeners=PLAINTEXT://:9093
    log.dirs=/tmp/kafka-logs-1
 
config/server-2.properties:
    broker.id=2
    listeners=PLAINTEXT://:9094
    log.dirs=/tmp/kafka-logs-2

roker.id 在集群中必须唯一

listeners 监听地址

log.dirs 日志数据目录

启动

bin/kafka-server-start.sh config/server-1.properties
bin/kafka-server-start.sh config/server-2.properties

create topics

官方例子是一个partitions, 三个 replication

bin/kafka-topics.sh --create --bootstrap-server localhost:9092 --replication-factor 3 --partitions 2 --topic my-replicated-topic

查看该主题的brokers

bin/kafka-topics.sh --describe --bootstrap-server localhost:9092 --topic my-replicated-topic

复制代码

[root@localhost kafka_2.12-2.5.0]# bin/kafka-topics.sh --describe --bootstrap-server localhost:9092 --topic my-replicated-topic
Topic: my-replicated-topic      PartitionCount: 2       ReplicationFactor: 3    Configs: segment.bytes=1073741824
        Topic: my-replicated-topic      Partition: 0    Leader: 1       Replicas: 1, 2, 0 Isr: 1, 2, 0
        Topic: my-replicated-topic      Partition: 1    Leader: 0       Replicas: 0, 1, 2 Isr: 0, 1, 2

解析

第一行..略

主题有2个partitions 所以有两行

复制代码

Topic: my-replicated-topic      Partition: 0    Leader: 1       Replicas: 1, 2, 0 Isr: 1, 2, 0

拿partition:0这个分区来说, (Leader: 1 ) 该分区的Leader是server1, (Replicas: 1, 2, 0) 分布在id为1, 2, 0这三个节点上, **(Isr:1, 2, 0)**而且这三个节点都活着;

Leader: 是指负责这个分区所有读写的节点;

Replicas: 是指这个分区所在的所有节点（不论它是否活着）;
ISR是Replicas的子集 , 代表存有这个分区信息而且当前活着的节点;或者说指向有该Partition的备份且活着的节点

这些角色貌似都是自动分配的...

sh 复制代码

# 列出主题列表
./bin/kafka-topics.sh --list --zookeeper localhost:2181

架构图

把第0的server 停掉 bin/kafka-server-start.sh config/server.properties

复制代码

# 再查下 (9092 停了 ,  去9093查)
bin/kafka-topics.sh --describe --bootstrap-server localhost:9093 --topic my-replicated-topic

s 复制代码

[root@localhost kafka_2.12-2.5.0]# bin/kafka-topics.sh --describe --bootstrap-server localhost:9093 --topic my-replicated-topic
Topic: my-replicated-topic      PartitionCount: 2       ReplicationFactor: 3    Configs: segment.bytes=1073741824
        Topic: my-replicated-topic      Partition: 0    Leader: 1       Replicas: 1, 2, 0 Isr: 1, 2
        Topic: my-replicated-topic      Partition: 1    Leader: 1       Replicas: 0, 1, 2 Isr: 1, 2

第0个, 就不在ISR列表里面了.

附录 kafka server.properties 配置

也可以参考官方文档

ini 复制代码

broker.id =0
每一个broker在集群中的唯一表示,  要求是正数; 当该服务器的IP地址发生改变时,  broker.id没有变化,  则不会影响consumers的消息情况
log.dirs=/data/kafka-logs
kafka数据的存放地址,  多个地址的话用逗号分割 /data/kafka-logs-1,  /data/kafka-logs-2
port =9092
broker server服务端口
message.max.bytes =6525000
表示消息体的最大大小,  单位是字节
num.network.threads =4
broker处理消息的最大线程数,  一般情况下不需要去修改
num.io.threads =8
broker处理磁盘IO的线程数,  数值应该大于你的硬盘数
background.threads =4
一些后台任务处理的线程数,  例如过期消息文件的删除等,  一般情况下不需要去做修改
queued.max.requests =500
等待IO线程处理的请求队列最大数,  若是等待IO的请求超过这个数值,  那么会停止接受外部消息,  应该是一种自我保护机制; 
host.name
broker的主机地址,  若是设置了,  那么会绑定到这个地址上,  若是没有,  会绑定到所有的接口上,  并将其中之一发送到ZK,  一般不设置
socket.send.buffer.bytes=100*1024
socket的发送缓冲区,  socket的调优参数SO_SNDBUFF
socket.receive.buffer.bytes =100*1024
socket的接受缓冲区,  socket的调优参数SO_RCVBUFF
socket.request.max.bytes =100*1024*1024
socket请求的最大数值,  防止serverOOM,  message.max.bytes必然要小于socket.request.max.bytes,  会被topic创建时的指定参数覆盖
log.segment.bytes =1024*1024*1024
topic的分区是以一堆segment文件存储的,  这个控制每个segment的大小,  会被topic创建时的指定参数覆盖
log.roll.hours =24*7
这个参数会在日志segment没有达到log.segment.bytes设置的大小,  也会强制新建一个segment会被 topic创建时的指定参数覆盖
log.cleanup.policy = delete
日志清理策略选择有: delete和compact主要针对过期数据的处理,  或是日志文件达到限制的额度,  会被 topic创建时的指定参数覆盖
log.retention.minutes=60*24 # 一天后删除
数据存储的最大时间超过这个时间会根据log.cleanup.policy设置的策略处理数据,  也就是消费端能够多久去消费数据
log.retention.bytes和log.retention.minutes任意一个达到要求,  都会执行删除,  会被topic创建时的指定参数覆盖
log.retention.bytes=-1
topic每个分区的最大文件大小,  一个topic的大小限制 = 分区数*log.retention.bytes; -1没有大小限log.retention.bytes和log.retention.minutes任意一个达到要求,  都会执行删除,  会被topic创建时的指定参数覆盖
log.retention.check.interval.ms=5minutes
文件大小检查的周期时间,  是否处罚 log.cleanup.policy中设置的策略
log.cleaner.enable=false
是否开启日志压缩
log.cleaner.threads = 2
日志压缩运行的线程数
log.cleaner.io.max.bytes.per.second=None
日志压缩时候处理的最大大小
log.cleaner.dedupe.buffer.size=500*1024*1024
日志压缩去重时候的缓存空间,  在空间允许的情况下,  越大越好
log.cleaner.io.buffer.size=512*1024
日志清理时候用到的IO块大小一般不需要修改
log.cleaner.io.buffer.load.factor =0.9
日志清理中hash表的扩大因子一般不需要修改
log.cleaner.backoff.ms =15000
检查是否处罚日志清理的间隔
log.cleaner.min.cleanable.ratio=0.5
日志清理的频率控制,  越大意味着更高效的清理,  同时会存在一些空间上的浪费,  会被topic创建时的指定参数覆盖
log.cleaner.delete.retention.ms =1day
对于压缩的日志保留的最长时间,  也是客户端消费消息的最长时间,  同log.retention.minutes的区别在于一个控制未压缩数据,  一个控制压缩后的数据; 会被topic创建时的指定参数覆盖
log.index.size.max.bytes =10*1024*1024
对于segment日志的索引文件大小限制,  会被topic创建时的指定参数覆盖
log.index.interval.bytes =4096
当执行一个fetch操作后,  需要一定的空间来扫描最近的offset大小,  设置越大,  代表扫描速度越快,  但是也更好内存,  一般情况下不需要搭理这个参数
log.flush.interval.messages=None
log文件"sync"到磁盘之前累积的消息条数, 因为磁盘IO操作是一个慢操作, 但又是一个"数据可靠性"的必要手段, 所以此参数的设置, 需要在"数据可靠性"与"性能"之间做必要的权衡.如果此值过大, 将会导致每次"fsync"的时间较长(IO阻塞), 如果此值过小, 将会导致"fsync"的次数较多, 这也意味着整体的client请求有一定的延迟.物理server故障, 将会导致没有fsync的消息丢失.
log.flush.scheduler.interval.ms =3000
检查是否需要固化到硬盘的时间间隔
log.flush.interval.ms = None
仅仅通过interval来控制消息的磁盘写入时机, 是不足的.此参数用于控制"fsync"的时间间隔, 如果消息量始终没有达到阀值, 但是离上一次磁盘同步的时间间隔达到阀值, 也将触发.
log.delete.delay.ms =60000
文件在索引中清除后保留的时间一般不需要去修改
log.flush.offset.checkpoint.interval.ms =60000
控制上次固化硬盘的时间点,  以便于数据恢复一般不需要去修改
auto.create.topics.enable =true
是否允许自动创建topic,  若是false,  就需要通过命令创建topic
default.replication.factor =1
是否允许自动创建topic,  若是false,  就需要通过命令创建topic
num.partitions =1
每个topic的分区个数,  若是在topic创建时候没有指定的话会被topic创建时的指定参数覆盖
 
 
########### 以下是kafka中Leader, replicas配置参数
 
controller.socket.timeout.ms =30000
partition leader与replicas之间通讯时, socket的超时时间
controller.message.queue.size=10
partition leader与replicas数据同步时, 消息的队列尺寸
replica.lag.time.max.ms =10000
replicas响应partition leader的最长等待时间,  若是超过这个时间,  就将replicas列入ISR(in-sync replicas),  并认为它是死的,  不会再加入管理中
replica.lag.max.messages =4000
如果follower落后与leader太多, 将会认为此follower[或者说partition relicas]已经失效
##通常, 在follower与leader通讯时, 因为网络延迟或者链接断开, 总会导致replicas中消息同步滞后
##如果消息之后太多, leader将认为此follower网络延迟较大或者消息吞吐能力有限, 将会把此replicas迁移
##到其他follower中.
##在broker数量较少, 或者网络不足的环境中, 建议提高此值.
replica.socket.timeout.ms=30*1000
follower与leader之间的socket超时时间
replica.socket.receive.buffer.bytes=64*1024
leader复制时候的socket缓存大小
replica.fetch.max.bytes =1024*1024
replicas每次获取数据的最大大小
replica.fetch.wait.max.ms =500
replicas同leader之间通信的最大等待时间,  失败了会重试
replica.fetch.min.bytes =1
fetch的最小数据尺寸, 如果leader中尚未同步的数据不足此值, 将会阻塞, 直到满足条件
num.replica.fetchers=1
leader进行复制的线程数,  增大这个数值会增加follower的IO
replica.high.watermark.checkpoint.interval.ms =5000
每个replica检查是否将最高水位进行固化的频率
controlled.shutdown.enable =false
是否允许控制器关闭broker , 若是设置为true, 会关闭所有在这个broker上的leader,  并转移到其他broker
controlled.shutdown.max.retries =3
控制器关闭的尝试次数
controlled.shutdown.retry.backoff.ms =5000
每次关闭尝试的时间间隔
leader.imbalance.per.broker.percentage =10
leader的不平衡比例,  若是超过这个数值,  会对分区进行重新的平衡
leader.imbalance.check.interval.seconds =300
检查leader是否不平衡的时间间隔
offset.metadata.max.bytes
客户端保留offset信息的最大空间大小
kafka中zookeeper参数配置
 
zookeeper.connect = localhost:2181
zookeeper集群的地址,  可以是多个,  多个之间用逗号分割 hostname1:port1, hostname2:port2, hostname3:port3
zookeeper.session.timeout.ms=6000
ZooKeeper的最大超时时间,  就是心跳的间隔,  若是没有反映,  那么认为已经死了,  不易过大
zookeeper.connection.timeout.ms =6000
ZooKeeper的连接超时时间
zookeeper.sync.time.ms =2000

一文入门和实践Kafka

Kafka

核心概念

Broker 节点

主题中的分区(partition)

Partition 和 Broker的数量

Kafka 何以高性能?

消息流程

集群的消息传递

消息投递

Leader 和选举

怎样处理某个Replica不工作的情况?

Kafka 与 Zookeeper

Quickstart

Step 1: Download the code

Step 2: Start the server

Step 3: Create a topic

Step 4: Send some messages

Step 5: Start a consumer

Step 6: Setting up a multi-broker cluster

server 配置文件

启动

create topics

查看该主题的brokers

架构图

附录 kafka server.properties 配置