Kafka（十一）管理Kafka

管理Kafka
- [1 命令行操作](#1 命令行操作)
- - [1.1 Topic操作](#1.1 Topic操作)
  - - [1.1.1 创建主题](#1.1.1 创建主题)
    - [1.1.2 列出集群所有主题](#1.1.2 列出集群所有主题)
    - [1.1.3 列出主题详情](#1.1.3 列出主题详情)
    - [1.1.4 增加主题分区数](#1.1.4 增加主题分区数)
    - [1.1.5 减少主题分区数](#1.1.5 减少主题分区数)
    - [1.1.6 删除主题](#1.1.6 删除主题)
  - [1.2 生产和消费](#1.2 生产和消费)
  - - [1.2.1 控制台生产者](#1.2.1 控制台生产者)
    - [1.2.2 控制台消费者](#1.2.2 控制台消费者)
  - [1.3 消费者群组](#1.3 消费者群组)
  - - [1.3.1 列出并描述群组](#1.3.1 列出并描述群组)
    - [1.3.2 删除消费者群组](#1.3.2 删除消费者群组)
    - [1.3.3 删除偏移量](#1.3.3 删除偏移量)
    - [1.3.4 重置偏移量](#1.3.4 重置偏移量)
    - [1.3.5 导出/导入偏移量](#1.3.5 导出/导入偏移量)
  - [1.4 动态配置变更](#1.4 动态配置变更)
  - - [1.4.1 覆盖主题的默认配置](#1.4.1 覆盖主题的默认配置)
    - [1.4.2 覆盖客户端和用户的默认配置](#1.4.2 覆盖客户端和用户的默认配置)
    - [1.4.3 覆盖broker的默认配置](#1.4.3 覆盖broker的默认配置)
  - [1.5 分区管理](#1.5 分区管理)
  - - [1.5.1 首选首领选举](#1.5.1 首选首领选举)
    - [1.5.2 修改分区的副本](#1.5.2 修改分区的副本)
    - [1.5.3 修改复制系数](#1.5.3 修改复制系数)
    - [1.5.4 取消分区重分配](#1.5.4 取消分区重分配)
    - [1.5.5 转储日志片段](#1.5.5 转储日志片段)
    - [1.5.6 验证副本](#1.5.6 验证副本)
  - [1.6 其他工具](#1.6 其他工具)
  - [1.7 不安全操作](#1.7 不安全操作)
- [2 编程方式](#2 编程方式)

管理Kafka

管理Kafka集群意味着需要使用额外的工具对主题、配置等做出修改，可以通过命令行脚本和编程的方式对Kafka进行管理。

1 命令行操作

Kafka提供了一些命令行工具,以用于对集群做出变更。这些工具使用Java类实现,Kafka提供了一些脚本来调用它们。不过,这些工具只提供了基本的功能,无法完成复杂的操作,难以被用于管理大规模的集群。

虽然Kafka为主题操作提供了身份验证和授权机制,但默认配置并没有对这些工具的使用进行严格的限制。也就是说,不需要经过身份验证也可以使用这些工具,并可以在没有安全检查和审计的情况下执行诸如修改主题之类的操作。为防止发生未经授权的变更,需要确保只有管理员可以使用这些工具。

脚本	说明
kafka-topics.sh	执行大部分与主题相关的操作

通用参数	参数值示例	说明
--bootstrap-server	172.26.143.96:9092	要连接的集群入口主机和端口
--command-config
--config

1.1 Topic操作

1.1.1 创建主题

脚本	参数	参数值示例	说明
kafka-topics.sh	--create	N/A	要用脚本执行的命令名：创建主题
	--topic	peter-test-1	要创建的主题的名称
	--replication-factor	3	主题的副本数
	--partitions	8	主图的分区数
	--disable-rack-aware	N/A	关闭机架感知分配策略
	--if-not-exists	N/A	一般用于自动化执行脚本中，如果主题不存在就创建，如果存在就忽略，不会报错

例如，以下命令创建名为peter-test-1的topic, topic拥有8个分区，每个分区有3个副本。

kafka-topics.sh --bootstrap-server 172.26.143.96:9092 \

-create \

-topic peter-test-1 \

-replication-factor 3 \

-partitions 8

Created topic peter-test-1.
主题命名最佳实践

主题的名字可以包含："字母数字 _ - ."。

不建议使用"."。Kafka的内部指标会将点号转成下划线（例如,"topic.1"在指标中会变成"topic_1"）,这可能会导致主题名称冲突。

避免使用双下划线作为主题名字的前缀。根据约定,Kafka内部主题的名字以双下划线开头(例如，用于保存消费者组偏移量的_consumer_offsets主题)。因此，为了避免冲突，不建议使用以双下划线开头的主题名字。

1.1.2 列出集群所有主题

脚本	参数	参数值示例	说明
kafka-topics.sh	--list	N/A	要用脚本执行的命令名：列出集群所有主题

例如：

kafka-topics.sh --bootstrap-server 172.26.143.96:9092 --list

__consumer_offsets

connect-configs

connect-offsets

connect-status

connect-test

peter-test-1

product

rh.peter.first-demo.uata

string

test

1.1.3 列出主题详情

此命令还可按照参数过滤主题。

脚本	参数	参数值示例	说明
kafka-topics.sh	--describe	N/A	要用脚本执行的命令名：列出主题详细信息。
	--topic	peter-test-1	要创建的主题的名称。
	--topics-with-overrides	N/A	这个参数只会列出配置参数与集群默认值不同的主题。
	--exclude-internal	N/A	排除内部主题，它可以将所有名字以双下划线开头的主题排除。
	--under-replicated-partitions	N/A	这个参数可以找出一个或多个副本与首领不同步的分区。这并不一定是坏事,因为集群维护、部署和再均衡都会导致分区副本不同步,但还是要注意一下。
	--at-min-isr-partitions	N/A	这个参数可以找出副本数量(包括首领在内)与配置的最少同步副(ISR)数完全匹配的分区。这些主题对生产者客户端或消费者客户端来说仍然可用,但已无冗余,有会变得不可用的风险。
	--under-min-isr-partitions	N/A	这个参数可以找出ISR数低于配置的最小值的分区。这些分区实际上处于只读模式,不能向其写入数据。
	--unavailable-partitions	N/A	这个参数可以找出所有没有首领的分区。这种情况很严重,说明分区已离线,对生产者客户端或消费者客户端来说已经是不可用的。

例如，列出主题peter-test-1的详情：

kafka-topics.sh --bootstrap-server 172.26.143.96:9092 \

-describe \

-topic peter-test-1

Topic: peter-test-1 TopicId: FxU6YJeJRhCzfEU0Ykdxrg PartitionCount: 8 ReplicationFactor: 3 Configs:

Topic: peter-test-1 Partition: 0 Leader: 0 Replicas: 0,2,1 Isr: 0,2,1

Topic: peter-test-1 Partition: 1 Leader: 2 Replicas: 2,1,0 Isr: 2,1,0

Topic: peter-test-1 Partition: 2 Leader: 1 Replicas: 1,0,2 Isr: 1,0,2

Topic: peter-test-1 Partition: 3 Leader: 0 Replicas: 0,1,2 Isr: 0,1,2

Topic: peter-test-1 Partition: 4 Leader: 2 Replicas: 2,0,1 Isr: 2,0,1

Topic: peter-test-1 Partition: 5 Leader: 1 Replicas: 1,2,0 Isr: 1,2,0

Topic: peter-test-1 Partition: 6 Leader: 0 Replicas: 0,2,1 Isr: 0,2,1

Topic: peter-test-1 Partition: 7 Leader: 2 Replicas: 2,1,0 Isr: 2,1,0

列出全部主题的详情：

kafka-topics.sh --bootstrap-server 172.26.143.96:9092 \

-describe

列出所有包含覆盖配置的主题：

kafka-topics.sh --bootstrap-server 172.26.143.96:9092 \

-describe

-topics-with-overrides

Topic: connect-configs TopicId: RTX3bvm_Q1-jejm46FvnFA PartitionCount: 1 ReplicationFactor: 1 Configs: cleanup.policy=compact

Topic: connect-status TopicId: Ctrwua68St2t8Ts4Kx1FFA PartitionCount: 5 ReplicationFactor: 1 Configs: cleanup.policy=compact

Topic: connect-offsets TopicId: ylIyMa4OTrGNFAHc6HscEQ PartitionCount: 25 ReplicationFactor: 1 Configs: cleanup.policy=compact

Topic: __consumer_offsets TopicId: eqrfiDaATLenrIE5MT5OaQ PartitionCount: 50 ReplicationFactor: 1 Configs: compression.type=producer,cleanup.policy=compact,segment.bytes=104857600

1.1.4 增加主题分区数

脚本	参数	参数值示例	说明
kafka-topics.sh	--alter	N/A	要用脚本执行的命令名：
	--topic	peter-test-1	要修改的主题的名称
	--partitions	8	主题的分区数
	--if-exists	N/A	一般用于自动化执行脚本中，如果主题存在就执行命令，如果不存在就忽略，不会报错。不建议使用它。这是因为如果指定了这个选项,并且要修改的主题不存在,那么 -- alter命令就不会返回任何错误,从而掩盖了本应创建这个不存在的主题的错误。

例如，增加主题的分区数（replication-factor无法修改）：

kafka-topics.sh --bootstrap-server 172.26.143.96:9092 \

-alter \

-topic peter-test-1 \

-partitions 4
调整包含键的主题

从消费者角度来看,为包含键的主题添加分区是很困难的。这是因为如果改变了分区数量,那么键与分区之间的映射也会发生变化。因此,对于包含键的主题,建议一开始就设置好分区数量,避免后续对其进行调整。

1.1.5 减少主题分区数

我们不可能减少主题的分区数量。如果删除了主题的一个分区,那么这个分区里的数据也会被删除,导致客户端看到的数据不一致。此外,将数据重新分布到其余的分区中是非常困难的,即使能够做到,也无法保证消息的顺序。

如果要减少分区数量,则建议册除整个主题并重新创建,或者(如果不能删除的话)创建一个新主题(比如叫作"mytopic-v2"),并将所有流量重定向到新主题。

1.1.6 删除主题

脚本	参数	参数值示例	说明
kafka-topics.sh	--delete	N/A	要用脚本执行的命令名：删除主题
	--topic	peter-test-1	要修改的主题的名称

例如，删除主题peter-test-1：

kafka-topics.sh --bootstrap-server 172.26.143.96:9092 \

-delete \

-topic peter-test-1

1.2 生产和消费

在使用Kafka时,为了验证应用程序的逻辑,经常需要手动生成或消费一些示例消息。

Kafka为此提供了两个工具,即kafka-console-consumer.sh和kafka-console-producer.sh在第2章中,我们用它们验证过安装好的Kafka是否可以正常运行。这些工具对Java客端库进行了包装,让我们可以在不编写代码的情况下与Kafka主题发生交互。

将输出作为其他应用程序的输入

虽然可以编写应用程序将控制台消费者或控制台生产者包装起来(例如,用它读取息,再把消息传给另一个应用程序),但这种应用程序太过脆弱,所以应该尽量避免这么做。我们很难保证控制台消费者不丢失数据。同样,我们也无法充分利用控制台生产者的所有特性,正确地发送字节是很困难的。建议直接使用Java客户端,或其他实现了Kafka协议的第三方客户端。

1.2.1 控制台生产者

脚本	参数	参数值示例	说明
kafka-console-producer.sh	--topic	peter-test-1	要写入的主题的名称
	--producer.config	$KAFKA_HOME/config/producer.properties	要传递给控制台生产者的参数的配置文件路径
	--producer-property	batch.size=1024 timeout=1000 compression.type=none/gzip/snappy/zstd/lz4	直接传递给控制台生产者的参数
	--batch-size	1024
	--timeout	1000
	--compression-codex	none/gzip/snappy/zstd/lz4
	--sync	true/false
	--property	ignore.error=true/false parse.key=true/false key.separator=true/fase	用来传递参数给消息格式化器
	--line-reader	kafka.tools.Console Producer$LineMessageReader。	可以使用自定义类来读取命令行输入。自定义类必须继承kafka.common.MessageReader,并负责创建ProducerRecord对象。确保包含这个类的JAR包已经被加入类路径中。

例如，向主题写入三条命令：

kafka-console-producer.sh --bootstrap-server 172.26.143.96:9092 --topic peter-test-1

>message-1

>message-2

>message-3

使用配置文件：

kafka-console-producer.sh --bootstrap-server 172.26.143.96:9092 \

-producer.config $KAFKA_HOME/config/producer.properties \

-topic peter-test-1

>message-4

>

让生产者等待5秒钟再发送消息：

kafka-console-producer.sh --bootstrap-server 172.26.143.96:9092 \

-producer-property linger.ms=5000 \

-topic peter-test-1

>message-4

>

设置键值的分隔符为!：

kafka-console-producer.sh --bootstrap-server 172.26.143.96:9092 \

-topic peter-test-1 \

-producer-property linger.ms=5000 \

-producer-property sync=true \

-property ignore.error=true \

-property parse.key=true \

-property key.separator=!

>a!b

>

启动一个异步生产者，批量发送1M数据，10秒钟数据量不够，直接发送

kafka-console-producer.sh --bootstrap-server 172.26.143.96:9092 \

-topic peter-test-1 \

-producer-property --sync=false --batch-size=1024000 --timeout=10000 --line-reader kafka.tools.ConsoleProducer\$LineMessageReader \

-property --ignore.error=false

1.2.2 控制台消费者

kafka-console-consumer.sh为我们提供了另外一种从Kafka集群的一个或多个主题读取消息的方式。它读取的消息会被打印在标准输出中,并用换行符分隔。在默认情况下,它将输出消息的原始字节,没有键,也不进行格式化(使用DefaultFormatter)。

检查工具版本

控制台消费者的版本要与broker的版本相同,这一点非常重要。旧版控制台消费者与集群或ZooKeeper之间不恰当的交互行为可能对集群造成不良影响。

脚本	参数	参数值示例	说明
kafka-console-consumer.sh	--topic	peter-test-1	要读取的主题的名称
	--include	'peter.*'	这个参数是一个正则表达式,其匹配所有要读取的主题(要记得转义正则表达式,以免命令行解析错误)。
	--consumer.config	$KAFKA_HOME/config/consumer.properties	要传递给控制台生产者的参数的配置文件路径
	--consumer-property		直接传递给控制台消费者的参数
	--formatter	kafka.tools.DefaultMessageFormatter默认值 kafka.tools.LoggingMessageFormatter将消息输出到日志而不是标准输出。对应的日志级别为INFO,打印内容包含消息的时间戳、键和值。 kafka.tools.NoOpMessageFormatter读取但不打印消息。	指定用于解码消息的消息格式化器的类名，默认是kafka.tools.DefaultMessageFormatter。
	--from-beginning	N/A	指定从最旧的偏移量开始读取数据。如果不指定这个参数,就从最新的偏移量开始读取。
	--max-messages	1	指定在退出之前最多读取多少条消息。
	--partition	1	只读取指定ID的分区。
	--offset	1	如果提供的是整数,就从指定位置开始读取数据。其他有效的值为earliest(将从起始位置开始读取)和latest(将从最近的位置开始读取)。
	--skip-message-on-error	N/A	如果在处理消息时出现错误就跳过消息,而不是一直挂起,这在调试问题时会非常有用。
	--property	print.timestamp 如果被设置为true,那么将打印每条消息的时间戳(如果有的话) print.key 如果被设置为true,那么除了打印消息的值,还会打印消息的键 print.offset 如果被设置为true,那么除了打印消息的值,还会打印消息的偏移量 print.partition 如果被设置为true,那么将打印消息来自哪个分区 key. separator 指定打印消息的键和值时所使用的分隔符 line.separator 指定消息之间的分隔符 key.deserializer 指定打印消息的键所使用的反序列化器的类名 value.deserializer 指定打印消息的值所使用的反序列化器的类名	用来传递参数给消息格式化器

例如：

kafka-console-consumer.sh --bootstrap-server 172.26.143.96:9092 \

-include peter-test-1 \

-from-beginning \

-formatter kafka.tools.NoOpMessageFormatter

有时候,需要查有集群的消费者群组提交了哪些偏移量。例如,你可能想知道某个消费者我组是否在提交偏核量,或者在以怎样的频率提交偏移量。这可以通过使用控制消费者__consumer_offsets 这个特殊的内部主题来实现。所有的消费者偏移量都会被写入这个主题。要解码这个主题中的消息,必须使用kafka.coordinator.group.GroupmetadataManager$offsetsMessageFormatter 这个格式化器。

kafka-console-consumer.sh --bootstrap-server 172.26.143.96:9092 \

-topic __consumer_offsets \

-from-beginning \

-max-messages 9999 \

-formatter "kafka.coordinator.group.GroupMetadataManager\$OffsetsMessageFormatter" \

-consumer-property exclude.internal.topics=false

$connect-local-file-sink-1,connect-test,0\]::OffsetAndMetadata(offset=7, leaderEpoch=Optional.empty, metadata=, commitTimestamp=1705829404515, expireTimestamp=None) \[consumer-group-1,string,0\]::OffsetAndMetadata(offset=2, leaderEpoch=Optional.empty, metadata=, commitTimestamp=1711787448842, expireTimestamp=None) \[consumer-group-1,string,0\]::OffsetAndMetadata(offset=2, leaderEpoch=Optional.empty, metadata=, commitTimestamp=1711787456010, expireTimestamp=None) \[consumer-group-1,string,0\]::OffsetAndMetadata(offset=7, leaderEpoch=Optional\[12\], metadata=, commitTimestamp=1711787552460, expireTimestamp=None) \[connect-local-file-sink,connect-test,0\]::OffsetAndMetadata(offset=1, leaderEpoch=Optional.empty, metadata=, commitTimestamp=1705801372852, expireTimestamp=None) \[connect-local-file-sink,connect-test,0\]::NULL \[connect-local-file-sink-1,connect-test,0\]::NULL \^CProcessed a total of 73 messages$

1.3 消费者群组

1.3.1 列出并描述群组

脚本	参数	参数值示例	说明
kafka-consumer-groups.sh	--list	N/A	要用脚本执行的命令名：列出群组
	--describe	N/A	要用脚本执行的命令名：描述群组详情
	--all-groups	N/A	全部消费者群组
	--group	consumer-group-1	要描述的目标群组名称
	--members	N/A

列出所有的消费者群组：

kafka-consumer-groups.sh --bootstrap-server 172.26.143.96:9092 --list

console-consumer-53634

consumer-group-1

描述群组详情：

kafka-consumer-groups.sh --bootstrap-server 172.26.143.96:9092 --describe --group consumer-group-1

GROUP TOPIC PARTITION CURRENT-OFFSET LOG-END-OFFSET LAG CONSUMER-ID HOST CLIENT-ID

consumer-group-1 string 0 19 19 0 concurrency-listener-0-64b7c3e4-ddcc-44e8-8ce7-092580eeea0a /172.26.128.1 concurrency-listener-0

GROUP	TOPIC	PARTITION	CURRENT-OFFSET	LOG-END-OFFSET	LAG	CONSUMER-ID	HOST	CLIENT-ID
group name	topic name	parttion id	消费者最近提交的offset，也即在分区读取的当前位置	最高水位offset，最近一个被提交的offset	consumer和broker的offset的差距	consumer id	主机	客户端ID
consumer-group-1	string	0	19	19	0	concurrency-listener-0-64b7c3e4-ddcc-44e8-8ce7-092580eeea0a	/172.26.128.1	concurrency-listener-0

列出全部的消费者群组详情：

kafka-consumer-groups.sh --bootstrap-server 172.26.143.96:9092 --describe --all-groups

GROUP TOPIC PARTITION CURRENT-OFFSET LOG-END-OFFSET LAG CONSUMER-ID

HOST CLIENT-ID

console-consumer-29867 peter-test-1 1 - 9 - console-consumer-7e63d9e0-fd87-40a1-a513-dad97f26cacd /172.26.143.96 console-consumer

console-consumer-29867 peter-test-1 7 - 48 - console-consumer-7e63d9e0-fd87-40a1-a513-dad97f26cacd /172.26.143.96 console-consumer

console-consumer-29867 peter-test-1 2 - 1 - console-consumer-7e63d9e0-fd87-40a1-a513-dad97f26cacd /172.26.143.96 console-consumer

console-consumer-29867 peter-test-1 5 - 18 - console-consumer-7e63d9e0-fd87-40a1-a513-dad97f26cacd /172.26.143.96 console-consumer

console-consumer-29867 peter-test-1 6 - 5 - console-consumer-7e63d9e0-fd87-40a1-a513-dad97f26cacd /172.26.143.96 console-consumer

console-consumer-29867 peter-test-1 3 - 4 - console-consumer-7e63d9e0-fd87-40a1-a513-dad97f26cacd /172.26.143.96 console-consumer

console-consumer-29867 peter-test-1 4 - 8 - console-consumer-7e63d9e0-fd87-40a1-a513-dad97f26cacd /172.26.143.96 console-consumer

console-consumer-29867 peter-test-1 0 - 14 - console-consumer-7e63d9e0-fd87-40a1-a513-dad97f26cacd /172.26.143.96 console-consumer

GROUP TOPIC PARTITION CURRENT-OFFSET LOG-END-OFFSET LAG CONSUMER-ID

HOST CLIENT-ID

console-consumer-86638 peter-test-1 1 - 9 - console-consumer-4b5089a0-72fa-48aa-a572-be7c3ae46d90 /172.26.143.96 console-consumer

console-consumer-86638 peter-test-1 7 - 48 - console-consumer-4b5089a0-72fa-48aa-a572-be7c3ae46d90 /172.26.143.96 console-consumer

console-consumer-86638 peter-test-1 2 - 1 - console-consumer-4b5089a0-72fa-48aa-a572-be7c3ae46d90 /172.26.143.96 console-consumer

console-consumer-86638 peter-test-1 5 - 18 - console-consumer-4b5089a0-72fa-48aa-a572-be7c3ae46d90 /172.26.143.96 console-consumer

console-consumer-86638 peter-test-1 6 - 5 - console-consumer-4b5089a0-72fa-48aa-a572-be7c3ae46d90 /172.26.143.96 console-consumer

console-consumer-86638 peter-test-1 3 - 4 - console-consumer-4b5089a0-72fa-48aa-a572-be7c3ae46d90 /172.26.143.96 console-consumer

console-consumer-86638 peter-test-1 4 - 8 - console-consumer-4b5089a0-72fa-48aa-a572-be7c3ae46d90 /172.26.143.96 console-consumer

console-consumer-86638 peter-test-1 0 - 14 - console-consumer-4b5089a0-72fa-48aa-a572-be7c3ae46d90 /172.26.143.96 console-consumer

GROUP TOPIC PARTITION CURRENT-OFFSET LOG-END-OFFSET LAG CONSUMER-ID

HOST CLIENT-ID

consumer-group-1 string 0 19 19 0 concurrency-listener-0-c6f0d64b-20b3-444f-9509-f93c904ba126 /172.26.128.1 concurrency-listener-0

1.3.2 删除消费者群组

脚本	参数	参数值示例	说明
kafka-consumer-groups.sh	--delete	N/A	要用脚本执行的命令名：删除群组
	--group	console-consumer-53634	要描述的目标群组名称

delete命令将删除整个群组,包括所有已保存的偏移量。在删除群组之前,必须将群组里所有的消费者都关闭。如果你试图删除一个非空的群组,那么它将抛出"群组不为空"异常。也可以用这个命令删除单个主题的偏移量,只是需要额外提供 -- topic参数,并指定要删除的偏移量。

删除失败：

kafka-consumer-groups.sh --bootstrap-server 172.26.143.96:9092 --delete --group console-consumer-53634

Error: Deletion of some consumer groups failed:

* Group 'console-consumer-53634' could not be deleted due to: java.util.concurrent.ExecutionException: org.apache.kafka.common.errors.GroupNotEmptyException: The group is not empty.

删除成功：

kafka-consumer-groups.sh --bootstrap-server 172.26.143.96:9092 --delete --group console-consumer-53634

Deletion of requested consumer groups ('console-consumer-53634') was successful.

1.3.3 删除偏移量

脚本	参数	参数值示例	说明
kafka-consumer-groups.sh	--delete-offsets	N/A	要用脚本执行的命令名：删除偏移量
	--group	console-consumer-4771	目标群组名称

删除偏移量失败：

kafka-consumer-groups.sh --bootstrap-server 172.26.143.96:9092 --delete-offsets --group consumer-group-1 --topic string

Error: Encounter some partition level error, see the follow-up details:

TOPIC PARTITION STATUS

string 0 Error: org.apache.kafka.common.errors.GroupSubscribedToTopicException: Deleting offsets of a topic is forbidden while the consumer group is actively subscribed to it.

删除偏移量成功：

kafka-consumer-groups.sh --bootstrap-server 172.26.143.96:9092 --delete-offsets --group consumer-group-1 --topic string

Request succeed for deleting offsets with topic string group consumer-group-1

TOPIC PARTITION STATUS

string 0 Successful

1.3.4 重置偏移量

脚本	参数	参数值示例	说明
kafka-consumer-groups.sh	--reset-offsets	N/A	要用脚本执行的命令名：重置偏移量
	--group	console-consumer-1	目标群组名称
	--topic	string	目标主题名称
	--dry-run	N/A	实际执行之前演练一下
	--execute	N/A	实际执行
	--export	> /home/peter/offsets.csv	导出的文件路径
	--to-current	N/A	重置到当前位置
	--to-datetime	2024-03-30T16:32:32.000	允许你指定一个时间，然后将位移重置到该时间之后的最早位移处。常见的使用场景是，你想重新消费昨天的数据，那么你可以使用该策略重设位移到昨天 0 点。参数格式为YYYY-MM-DDTHH:mm:SS.sss。
	--to-earliest	N/A	重置为最旧的位置
	--to-latest	N/A	重置为最新的位置
	--to-offset	10	重置到指定的位置
	--shift-by	-9	相对当前的offset进行加减操作，可以是正负数，
	--by-duration	P0DT8H0M0S	相对当前的offset时间进行加减操作，参数格式为PnDTnHnMnS，例如P0DT8H0M0S表示移动到0天8小时0分钟0秒之后

查看当前偏移量：

kafka-consumer-groups.sh --bootstrap-server 172.26.143.96:9092 --describe --group consumer-group-1

GROUP TOPIC PARTITION CURRENT-OFFSET LOG-END-OFFSET LAG CONSUMER-ID

HOST CLIENT-ID

consumer-group-1 string 0 19 19 0 concurrency-listener-0-8ac82b76-3f5e-449e-924d-69ef720bc0d3 /172.26.128.1 concurrency-listener-0

重置偏移量执行失败，因为群组中还有活动的消费者：

kafka-consumer-groups.sh --bootstrap-server 172.26.143.96:9092 --reset-offsets --group consumer-group-1 --topic string --execute --to-earliest

Error: Assignments can only be reset if the group 'consumer-group-1' is inactive, but the current state is Stable.

GROUP TOPIC PARTITION NEW-OFFSET

关闭所有活动的消费者，可以先用参数--dry-run演习一下：

kafka-consumer-groups.sh --bootstrap-server 172.26.143.96:9092 --reset-offsets --group consumer-group-1 --topic string --dry-run --to-earliest

GROUP TOPIC PARTITION NEW-OFFSET

consumer-group-1 string 0 1

确定要执行之后，使用参数--execute实际执行

kafka-consumer-groups.sh --bootstrap-server 172.26.143.96:9092 --reset-offsets --group consumer-group-1 --topic string --execute --to-earliest

GROUP TOPIC PARTITION NEW-OFFSET

consumer-group-1 string 0 1

按照时间重置偏移量：

kafka-consumer-groups.sh --bootstrap-server 172.26.143.96:9092 --reset-offsets --group consumer-group-1 --topic string --execute --to-datetime 2024-03-30T10:00:00.000

GROUP TOPIC PARTITION NEW-OFFSET

consumer-group-1 string 0 7

查询指定时间戳后面最近的一个偏移量：

kafka-run-class.sh kafka.tools.GetOffsetShell --broker-list 172.26.143.96:9092 --topic string --time 1711787448842

string:0:2

然后就可以根据主题，分区，偏移量查询数据了：

kafka-console-consumer.sh --bootstrap-server 172.26.143.96:9092 --topic string --partition 0 --offset 2 --max-messages 10

{"id":0,"name":"iPhone 17"}

{"id":0,"name":"iPhone 17"}

{"id":0,"name":"iPhone 17"}

{"id":0,"name":"iPhone 17"}

{"id":0,"name":"iPhone 17"}

{"id":0,"name":"iPhone 17"}

{"id":0,"name":"iPhone 17"}

{"id":0,"name":"iPhone 17"}

{"id":0,"name":"iPhone 17"}

{"id":0,"name":"iPhone 17"}

Processed a total of 10 messages

1.3.5 导出/导入偏移量

除了显示和删除消费者群组的偏移量,还可以批量获取和保存消费者群组的偏移量,这在重置消费者偏移量时非常有用。当消费者因为某些原因需要重新读取消息或因为无法正常处理某些消息(比如格式错误的消息)需要跳过这些消息时就可以进行偏移量重置。

导出偏移量到指定文件：

kafka-consumer-groups.sh --bootstrap-server 172.26.143.96:9092 \

-reset-offsets --to-latest \

-group consumer-group-1 \

-topic string --dry-run \

-export > /home/peter/offsets.csv

查看文件内容：

cat offsets.csv

string,0,19

从指定文件导入偏移量：

kafka-consumer-groups.sh --bootstrap-server 172.26.143.96:9092 \

-reset-offsets \

-group consumer-group-1 \

-dry-run \

-from-file /home/peter/offsets.csv

GROUP TOPIC PARTITION NEW-OFFSET

consumer-group-1 string 0 19

1.4 动态配置变更

客户端、broker等都有大量的配置参数可以在运行时动态更新,无须关闭或重新部

零集群。可以使用kafka-config.sh来修改这些配置参数。目前,可以进行动态变更的配署参数主要有4种类型：主题、broker、用户和客户端。对于每一种类型,都有一些可以覆盖的配置。随着Kafka不断发布新版本,新的动态配置参数也会不断被添加进来,所以最好确保你使用的工具版本与Kafka版本相匹配。为了便于自动化管理动态配置参数,可以通过 -- add-config-file参数来指定包含了你想要配置的参数的文件。

脚本	参数	参数值示例	说明
kafka-configs.sh	--alter	N/A	要用脚本执行的命令名：修改配置
	--describe	N/A	描述被覆盖的配置详情
	--entity-type	topics/clients/users/brokers/broker-loggers/ips	要修改配置的实体类型
	--entity-name	peter-test-1	实体名称
	--add-config	compression.type	具体要添加的配置项

1.4.1 覆盖主题的默认配置

在默认情况下,静态的broker配置文件中已经提供了主题的一些默认设置(比如数据保留策略)。可以通过动态配置覆盖个别主题的默认值,以满足不同应用场景的需求。

配置项	描述
cleanup.policy	如果被设置为compact,则只有包含了键的最新消息会被保留下来(日志被压实),其他消息会被丢弃
compression.type	broker在将消息批次写入磁盘时所使用的压缩类型
delete.retention.ms	墓碑消息能够保留多久,以毫秒为单位。这个参数只对压缩日志类型的主题有效。墓碑消息key不为null，value为null。日志清理线程发现墓碑消息时，先进行常规清理，保留一段时间。
file.delete.delay.ms	从磁盘上删除日志片段和索引之前可以等待多长时间,以毫秒为单位
flush.messages	在冲刷到磁盘之前可以接收多少条消息
flush.ms	在将消息冲刷到磁盘之前可以等待多长时间,以毫秒为单位
follower.replication.throttled.replicas	在复制日志时需要根据跟随者副本进行节流的副本清单
index.interval.bytes	日志片段索引之间能够容纳的消息字节数
leader.replication.throttled.replica	在复制日志时需要根据首领副本进行节流的副本清单
max.compaction.lag.ms	一条消息可以不被压实的最长时间
Max.nessage.bytes	消息的最大字节数
message.downconversion.enable	如果启用了这个参数,则消息格式可以被转换成之前的版本
message.format.version	broker将消息写入磁盘时所使用的消息格式版本,必须是有效的API版本号
message.timestamp.difference.max.ms	消息自带的时间戳和broker收到消息时的时间戳之间最大的差值,以毫秒为单位。这个参数只在messsage.timestamp.type 被设为CreateTime时有效
message.timestamp.type	在将消息写入磁盘时使用哪一种时间戳。目前支持两个值:一个是CreateTime,指客户端指定的时间戳;一个是LogAppendTime,指消息被写入分区时的时间戳
min.cleanable.dirty.ratio	压实分区的频率,表示为未压缩日志片段数与总日志分段数之间的比例。这个参数只对压缩日志类型的主题有效
min.compaction.lag.ms	一条消息不被压实的最短时间
min.insync.replicas	可用分区的最少ISR
preallocate	如果被设置为true,那么需要为新的日志片段预分配空间
retention.bytes	主题能够保留多少消息,以字节为单位
retention.ms	主题需要保留消息多长时间,以毫秒为单位
segment.bytes	分区的单个日志片段可以保存的消息字节数
segment.index.bytes	单个日志片段的最大索引字节数
segment.jitter.ms	在滚动日志片断时,在segment.ms基础上随机增加的毫秒数
segment.ms	日志片段多长时间滚动一次,以毫秒为单位
unclean. leader.election.enable	如果被设置为false,就不进行不彻底的首领选举

将主题的数据保存时间设置为1小时

kafka-configs.sh --bootstrap-server 172.26.143.96:9092 \

-alter \

-entity-type topics \

-entity-name peter-test-1 \

-add-config retention.ms=3600000

Completed updating config for topic peter-test-1.

查看被覆盖的默认配置

kafka-configs.sh --bootstrap-server 172.26.143.96:9092 \

-describe \

-entity-type topics \

-entity-name peter-test-1

Dynamic configs for topic peter-test-1 are:

retention.ms=3600000 sensitive=false synonyms={DYNAMIC_TOPIC_CONFIG:retention.ms=3600000}

删除被覆盖的配置

kafka-configs.sh --bootstrap-server 172.26.143.96:9092 \

-alter --entity-type topics \

-entity-name peter-test-1 \

-delete-config retention.ms

Completed updating config for topic peter-test-1.

1.4.2 覆盖客户端和用户的默认配置

对Kafka客户端和用户配置来说,只有少数参数可以覆盖,而且基本上都与配额有关。常见的两个需要修改的参数是生产者的生产速率和消费者的消费速率,以字节/秒为单位。

配置项	描述
consumer_bytes_rate	单个消费者每秒可以从单个broker 读取的消息字节数
producer_bytes_rate	单个生产者每秒可以向单个broker生成的消息字节数
controller_mutations_rate	可接受的创建主题请求、创建分区请求和删除主题请求的速率。这个速率是根据创建或删除的分区数量累计计算出来的
request_percentage	用户请求或客户端请求的配额窗口百分比((num.io.threads+num.network.threads) × 100%)

同时修改用户和客户端的控制器突变率：

kafka-configs.sh --bootstrap-server 172.26.143.96:9092 \

-alter \

-entity-type clients \

-entity-name concurrency-listener-0 \

-entity-type users \

-entity-name peter \

-add-config controller_mutation_rate=10
不均衡集群的不均衡节流

因为节流是以broker为基础,所以集群中的分区首领需要均匀分布才能更好

地实现节流策略。假设你在一个集群中有5个broker,并为一个客户端指定

了10MBps的生产者配额。如果分区首领均匀地分布在这5个broker上,那

么这个客户端就可以同时以10MBps的速率向每个broker生成数据,总共

50 MBps。但是,如果所有分区的首领都在同一个broker上,那么同一个生

产者的生产速率最多只能是10MBps。
客户端ID与消费者群组

客户端ID可以与消费者群组的名字不一样。消费者可以有自己的客户端

ID,因此不同群组里的消费者可以有相同的客户端ID。在为消费者设置客

户端ID时,最好可以使用能够表明它们所属群组的标识符,让群组可以共

享配额,以后在日志里查找哪个请求是被哪个群组处理的也更容易一些。

1.4.3 覆盖broker的默认配置

broker和集群级别的配置主要被放在静态的集群配置文件中,但仍然有大量的参数可以在行时修改,也就是说修改这些参数无须重新部署Kafka。我们可以用kafka-config.sh修以80多个broker配置参数，下面是其中几个比较重要的。

配置项	描述
min.insync.replicas	当生产者的acks 被设置为all或-1时,用于确认消息写入成功所需的最少ISR数。
unclean.leader.election.enable	允许一个副本被选举为首领,即使可能会导致数据丢失。当允许丢失一些数据,或者在发生不可恢复的数据丢失后需要快速恢复Kafka集群时,可以短暂启用这个功能。
max.connections	broker 允许的最大连接数。还可以用 max.connections.per.ipmax.connections.per.ip.override进行更细粒度的节流。

允许broker 0在不同步时也能参与不彻底的首领选举：

kafka-configs.sh --bootstrap-server 172.26.143.96:9092 \

-alter \

-broker 0 \

-add-config unclean.leader.election.enable=true

Completed updating config for broker 0.

查看修改的配置：

kafka-configs.sh --bootstrap-server 172.26.143.96:9092 \

-describe \

-broker 0

Dynamic configs for broker 0 are:

unclean.leader.election.enable=true sensitive=false synonyms={DYNAMIC_BROKER_CONFIG:unclean.leader.election.enable=true, DEFAULT_CONFIG:unclean.leader.election.enable=false}

1.5 分区管理

Kafka 提供了一些用于管理分区的脚本,其中一个用于重新选举首领,另一个用于将分区分配给broker。有了这两个工具,就可以通过手动的方式让消息流量均衡地分布在集群的broker上。

1.5.1 首选首领选举

Kafka集群所有的写入操作和读取操作都发生在分区首领所在的broker上。

为了保证负载均衡地分布在整个Kafka集群中,需要保持分区首领均衡地分布在broker上。

Kafka会将分区副本清单中的第一个ISR定义为首选首领。如果不启用自动首领均衡,那么在进行跨集群部署后可能会出现非常低效的均衡。因此,建议启用这个功能。

如果发现Kafka集群变得不均衡了,则可以考虑进行首选首领选举,这是一个轻量级的首领选举过程,一般来说不会造成负面影响。集群控制器会为分区选择理想的首领。

这个过程可以用kafka-leader-election.sh来手动触发。

脚本	参数	参数值示例	说明
kafka-leader-collection.sh	--election-type	PREFERRED/UNCLEAN	选举的类型
	--topic	peter-test-1	主题名称
	--partion	0	分区号码
	--all-topic-partitions	N/A	应用到所有主题的所有分区
	--path-to-json-file	/home/pater/partitions.json	要配置的分区很多时，但又不是全部分区，可以把特定分区的配置放在文件中，方便维护

指定分区进行首选首领选举：

kafka-leader-election.sh --bootstrap-server 172.26.143.96:9092 \

-election-type PREFERRED \

-topic peter-test-1 \

-partition 0

Valid replica already elected for partitions peter-test-1-0

从配置文件中读取分区信息：

kafka-leader-election.sh --bootstrap-server 172.26.143.96:9092 \

-election-type PREFERRED \

-path-to-json-file /home/peter/partitions.json

Valid replica already elected for partitions peter-test-1-0, peter-test-1-1

json 复制代码

{
	"partitions": [{
			"partition": 0,
			"topic": "peter-test-1"
		},
		{
			"partition": 1,
			"topic": "peter-test-1"
		}
	]
}

1.5.2 修改分区的副本

在某些情况下,可能需要手动修改分区的副本,下面是需要这样做的几种场景。

broker的负载分布不均衡,自动首领选举也无法解决这个问题。
broker 离线,造成分区不同步。
新加了broker,你想快速给它分配分区。
你想修改主题的复制系数。

可以用 kafka-reassign-partitions.sh来调整分区的副本。这个过程包含了多个步骤，具体步骤如下：

需要基于broker和主题生成一个迁移清单。要生成迁移清单,需要一个JSON文件,其中包含了要调整的主题。
执行调整。
这个工具可用于跟踪和验证分区调整的进度或完成情况。

脚本	参数	参数值示例	说明
kafka-reassignment.sh	--generate	N/A	命令：生成迁移文件
	--broker-list	1,2	要迁移去的目标broker列表
	--topics-to-move-json-file	/home/peter/topics.json	要迁移的主题列表文件
	--execute	N/A	命令：执行迁移
	--reassignment-json-file	/home/peter/reassignment.json	迁移清单文件路径
	--additional	N/A	如果已经有进行中的重分配过程,就加入其中,这样就不会出现中断,也不需要等待已有的重分配完毕之后再启动一个新的批次。
	--disable-rack-aware	N/A	有时候,因为启用了机架感知,可能无法实现想要的重分配状态。如果有必要,那么可以用这个参数禁用机架感知。
	--throttle	1024	这个参数以字节/秒为单位。分区重分配对集群性能有很大的影响,因为它们会导致内存缓存页的一致性发生变化,并占用额外的网络带宽和磁盘IO。对分区移动流量进行节流可以有效缓解这个问题。这个参数可以与 -- additional结合使用,以便对进行中的可能导致上述问题的重分配过程进行节流。
	--verify	N/A	命令：验证迁移的执行结果
	--cancel	N/A	命令：我们可以用它来取消集群中正在进行的重分配过程。如果指定了 --cancel选项,那么副本集将会被恢复到重分配之前的状态。如果正在从已经失效或过载的broker中移除副本,则取消分区重分配有可能会导致集群处于非预期的状态,也不能保证恢复后的副本集的顺序与之前相同。

新建一个包含2分区2副本的主题：

kafka-topics.sh --bootstrap-server 172.26.143.96:9092 --create --topic peter-test-2 --replication-factor 2 --partitions 2

Created topic peter-test-2.

查看默认的分区分配情况：

kafka-topics.sh --bootstrap-server 172.26.143.96:9092 --describe --topic peter-test-2

Topic: peter-test-2 TopicId: G7wcRNATSn-D4d1yDoiUlg PartitionCount: 2 ReplicationFactor: 2 Configs: unclean.leader.election.enable=true

Topic: peter-test-2 Partition: 0 Leader: 1 Replicas: 1,0 Isr: 1,0

Topic: peter-test-2 Partition: 1 Leader: 0 Replicas: 0,2 Isr: 0,2

假如我们计划停止broker 0，我们需要先将两个分区迁移到broker 1和2。首先准备要移动的topic清单，保存到文件：topics.json

json 复制代码

{
	"topics": [{
		"topic": "peter-test-2"
	}],
	"version": 1
}

执行命令生成移动清单：

kafka-reassign-partitions.sh --bootstrap-server 172.26.143.96:9092 --topics-to-move-json-file /home/peter/topics.json --broker-list 1,2 --generate

Current partition replica assignment

{"version":1,"partitions":[{"topic":"peter-test-2","partition":0,"replicas":[1,0],"log_dirs":["any","any"]},{"topic":"peter-test-2","partition":1,"replicas":[0,2],"log_dirs":["any","any"]}]}

Proposed partition reassignment configuration

{"version":1,"partitions":[{"topic":"peter-test-2","partition":0,"replicas":[2,1],"log_dirs":["any","any"]},{"topic":"peter-test-2","partition":1,"replicas":[1,2],"log_dirs":["any","any"]}]}

可以看到在重新分配的结果中，已经将broker 0排除了。将上述命令的输出保存到两个文件中，一个作为备份，一个作为下一步的输入。

备份文件：assignment.json

json 复制代码

{
	"version": 1,
	"partitions": [{
		"topic": "peter-test-2",
		"partition": 0,
		"replicas": [1, 0],
		"log_dirs": ["any", "any"]
	}, {
		"topic": "peter-test-2",
		"partition": 1,
		"replicas": [0, 2],
		"log_dirs": ["any", "any"]
	}]
}

重分配的输入文件：reassignment.json

json 复制代码

{
	"version": 1,
	"partitions": [{
		"topic": "peter-test-2",
		"partition": 0,
		"replicas": [2, 1],
		"log_dirs": ["any", "any"]
	}, {
		"topic": "peter-test-2",
		"partition": 1,
		"replicas": [1, 2],
		"log_dirs": ["any", "any"]
	}]
}

执行移动清单：

kafka-reassign-partitions.sh --bootstrap-server 172.26.143.96:9092 --reassignment-json-file /home/peter/reassignment.json --execute

Current partition replica assignment

{"version":1,"partitions":[{"topic":"peter-test-2","partition":0,"replicas":[1,0],"log_dirs":["any","any"]},{"topic":"peter-test-2","partition":1,"replicas":[0,2],"log_dirs":["any","any"]}]}

Save this to use as the --reassignment-json-file option during rollback

Successfully started partition reassignments for peter-test-2-0,peter-test-2-1

验证移动清单结果：

kafka-reassign-partitions.sh --bootstrap-server 172.26.143.96:9092 --reassignment-json-file /home/peter/reassignment.json --verify

Status of partition reassignment:

Reassignment of partition peter-test-2-0 is completed.

Reassignment of partition peter-test-2-1 is completed.

Clearing broker-level throttles on brokers 0,1,2

Clearing topic-level throttles on topic peter-test-2

最后查看主题详情：

kafka-topics.sh --bootstrap-server 172.26.143.96:9092 --describe --topic peter-test-2

Topic: peter-test-2 TopicId: G7wcRNATSn-D4d1yDoiUlg PartitionCount: 2 ReplicationFactor: 2 Configs:

Topic: peter-test-2 Partition: 0 Leader: 1 Replicas: 2,1 Isr: 1,2

Topic: peter-test-2 Partition: 1 Leader: 1 Replicas: 1,2 Isr: 2,1
如何移除一个broker

如果要移除一个broker的多个分区(将这个broker从集群中删除),那么最

好可以先移除这个broker所有的分区首领。这可以通过手动的方式实现,但

要用之前介绍的工具来完成这个操作有点儿困难。一些开源工具(如Cruise

Control)提供了broker"降级"等功能,它们可以安全地将broker的领导权

转移出去。这可能是最简单的方法。

如果不能使用这些工具,那么就重启broker。在broker被关闭的过程中,位

于这个broker上的所有分区首领都将被转移到其他broker上。这样可以显著

提高副本重分配的性能,并减少对集群的影响,因为复制流量被其他broker

分摊掉了。但是,如果启用了自动首领重分配,则broker在重启后有可能会

重新获得领导权。所以,在重启期间最好临时禁用这个功能。

1.5.3 修改复制系数

也可以用 kafka-reassign-partitions.sh来增加或减少一个分区的RF。

如果在创建分区时没有选择合适的RF,那么当你在扩展集群时想要增加冗余或为了节约成本想要减少冗余,就需要修改RF。一个很明显的例子是,如果集群的默认RF被修改了,但已有主题的RF个数不会自动随之发生变化,那么这个时候就可以用这个工具增加已有分区的RF。

假设需要为主题peter-test-2增加一个副本，将对分区的调整保存到文件：increase-rf.json

json 复制代码

{
	"version": 1,
	"partitions": [{
		"topic": "peter-test-2",
		"partition": 0,
		"replicas": [2, 1, 0],
		"log_dirs": ["any", "any", "any"]
	}, {
		"topic": "peter-test-2",
		"partition": 1,
		"replicas": [1, 2, 0],
		"log_dirs": ["any", "any", "any"]
	}]
}

执行命令：

kafka-reassign-partitions.sh --bootstrap-server 172.26.143.96:9092 --reassignment-json-file /home/peter/increase-rf.json --execute

Current partition replica assignment

{"version":1,"partitions":[{"topic":"peter-test-2","partition":0,"replicas":[2,1],"log_dirs":["any","any"]},{"topic":"peter-test-2","partition":1,"replicas":[1,2],"log_dirs":["any","any"]}]}

Save this to use as the --reassignment-json-file option during rollback

Successfully started partition reassignments for peter-test-2-0,peter-test-2-1

验证结果：

kafka-reassign-partitions.sh --bootstrap-server 172.26.143.96:9092 --reassignment-json-file /home/peter/increase-rf.json --verify

Status of partition reassignment:

Reassignment of partition peter-test-2-0 is completed.

Reassignment of partition peter-test-2-1 is completed.

Clearing broker-level throttles on brokers 0,1,2

Clearing topic-level throttles on topic peter-test-2

最后查看主题详情：

kafka-topics.sh --bootstrap-server 172.26.143.96:9092 --describe --topic peter-test-2

Topic: peter-test-2 TopicId: G7wcRNATSn-D4d1yDoiUlg PartitionCount: 2 ReplicationFactor: 3 Configs:

Topic: peter-test-2 Partition: 0 Leader: 1 Replicas: 2,1,0 Isr: 1,2,0

Topic: peter-test-2 Partition: 1 Leader: 1 Replicas: 1,2,0 Isr: 2,1,0

1.5.4 取消分区重分配

kafka-reassign-partitions.sh --bootstrap-server 172.26.143.96:9092 --reassignment-json-file /home/peter/increase-rf.json --cancel

None of the specified partition reassignments are active.

None of the specified partition moves are active.

Clearing broker-level throttles on brokers 0,1,2

Clearing topic-level throttles on topic peter-test-2

1.5.5 转储日志片段

有时候,你可能需要查看消息的内容,比如主题中出现了已损坏的"毒药"消息,而用户

无法处理它们。可以用kafka-dump-log.sh来解码分区的日志片段,这样就可以在不读取和解码消息的情况下查看消息的内容。这个工具以日志片段文件列表(以逗号分隔)作为参数,可以输出消息的摘要信息或详细内容。

在下面的例子中，对主题"peter-test-2"主题进行了日志转储。首先,简单地解码日志片段文件00000000000000000000.log,并获取每条消息的基本元数据信息,但不打印消息内容。Kafka的数据目录是/usr/local/bin/kafka_2.13-3.6.0/kafka-logs。因此,可以在/usr/local/bin/kafka_2.13-3.6.0/kafka-logs/-< partition>目录下找到转储文件,对这个例子来说就是/usr/local/bin/kafka_2.13-3.6.0/kafka-logs/peter-test-2-0/。

kafka-dump-log.sh --files $KAFKA_HOME/kafka-logs/peter-test-2-0/00000000000000000000.log

Dumping /usr/local/bin/kafka_2.13-3.6.0/kafka-logs/peter-test-2-0/00000000000000000000.log

Log starting offset: 0

baseOffset: 0 lastOffset: 2 count: 3 baseSequence: 0 lastSequence: 2 producerId: 7001 producerEpoch: 0 partitionLeaderEpoch: 9 isTransactional: false isControl: false deleteHorizonMs: OptionalLong.empty position: 0 CreateTime: 1711878013723 size: 87 magic: 2 compresscodec: none crc: 1713190284 isvalid: true

baseOffset: 3 lastOffset: 6 count: 4 baseSequence: 3 lastSequence: 6 producerId: 7001 producerEpoch: 0 partitionLeaderEpoch: 9 isTransactional: false isControl: false deleteHorizonMs: OptionalLong.empty position: 87 CreateTime: 1711878015016 size: 96 magic: 2 compresscodec: none crc: 361776245 isvalid: true

baseOffset: 7 lastOffset: 8 count: 2 baseSequence: 7 lastSequence: 8 producerId: 7001 producerEpoch: 0 partitionLeaderEpoch: 9 isTransactional: false isControl: false deleteHorizonMs: OptionalLong.empty position: 183 CreateTime: 1711878016979 size: 78 magic: 2 compresscodec: none crc: 125538935 isvalid: true

打印消息内容：

kafka-dump-log.sh --files $KAFKA_HOME/kafka-logs/peter-test-2-0/00000000000000000000.log --print-data-log

Dumping /usr/local/bin/kafka_2.13-3.6.0/kafka-logs/peter-test-2-0/00000000000000000000.log

Log starting offset: 0

baseOffset: 0 lastOffset: 2 count: 3 baseSequence: 0 lastSequence: 2 producerId: 7001 producerEpoch: 0 partitionLeaderEpoch: 9 isTransactional: false isControl: false deleteHorizonMs: OptionalLong.empty position: 0 CreateTime: 1711878013723 size: 87 magic: 2 compresscodec: none crc: 1713190284 isvalid: true

| offset: 0 CreateTime: 1711878012950 keySize: -1 valueSize: 1 sequence: 0 headerKeys: [] payload: 1

| offset: 1 CreateTime: 1711878013363 keySize: -1 valueSize: 1 sequence: 1 headerKeys: [] payload: 2

| offset: 2 CreateTime: 1711878013723 keySize: -1 valueSize: 1 sequence: 2 headerKeys: [] payload: 3

baseOffset: 3 lastOffset: 6 count: 4 baseSequence: 3 lastSequence: 6 producerId: 7001 producerEpoch: 0 partitionLeaderEpoch: 9 isTransactional: false isControl: false deleteHorizonMs: OptionalLong.empty position: 87 CreateTime: 1711878015016 size: 96 magic: 2 compresscodec: none crc: 361776245 isvalid: true

| offset: 3 CreateTime: 1711878014051 keySize: -1 valueSize: 1 sequence: 3 headerKeys: [] payload: 4

| offset: 4 CreateTime: 1711878014369 keySize: -1 valueSize: 1 sequence: 4 headerKeys: [] payload: 5

| offset: 5 CreateTime: 1711878014684 keySize: -1 valueSize: 1 sequence: 5 headerKeys: [] payload: 6

| offset: 6 CreateTime: 1711878015016 keySize: -1 valueSize: 1 sequence: 6 headerKeys: [] payload: 7

baseOffset: 7 lastOffset: 8 count: 2 baseSequence: 7 lastSequence: 8 producerId: 7001 producerEpoch: 0 partitionLeaderEpoch: 9 isTransactional: false isControl: false deleteHorizonMs: OptionalLong.empty position: 183 CreateTime: 1711878016979 size: 78 magic: 2 compresscodec: none crc: 125538935 isvalid: true

| offset: 7 CreateTime: 1711878016277 keySize: -1 valueSize: 1 sequence: 7 headerKeys: [] payload: 8

| offset: 8 CreateTime: 1711878016979 keySize: -1 valueSize: 1 sequence: 8 headerKeys: [] payload: 9

校验索引是否处于可用状态：

kafka-dump-log.sh --files $KAFKA_HOME/kafka-logs/peter-test-2-0/00000000000000000000.log --index-sanity-check

Dumping /usr/local/bin/kafka_2.13-3.6.0/kafka-logs/peter-test-2-0/00000000000000000000.log

Log starting offset: 0

baseOffset: 0 lastOffset: 2 count: 3 baseSequence: 0 lastSequence: 2 producerId: 7001 producerEpoch: 0 partitionLeaderEpoch: 9 isTransactional: false isControl: false deleteHorizonMs: OptionalLong.empty position: 0 CreateTime: 1711878013723 size: 87 magic: 2 compresscodec: none crc: 1713190284 isvalid: true

baseOffset: 3 lastOffset: 6 count: 4 baseSequence: 3 lastSequence: 6 producerId: 7001 producerEpoch: 0 partitionLeaderEpoch: 9 isTransactional: false isControl: false deleteHorizonMs: OptionalLong.empty position: 87 CreateTime: 1711878015016 size: 96 magic: 2 compresscodec: none crc: 361776245 isvalid: true

baseOffset: 7 lastOffset: 8 count: 2 baseSequence: 7 lastSequence: 8 producerId: 7001 producerEpoch: 0 partitionLeaderEpoch: 9 isTransactional: false isControl: false deleteHorizonMs: OptionalLong.empty position: 183 CreateTime: 1711878016979 size: 78 magic: 2 compresscodec: none crc: 125538935 isvalid: true

检查不匹配的索引：

kafka-dump-log.sh --files $KAFKA_HOME/kafka-logs/peter-test-2-0/00000000000000000000.log --verify-index-only

Dumping /usr/local/bin/kafka_2.13-3.6.0/kafka-logs/peter-test-2-0/00000000000000000000.log

Log starting offset: 0

baseOffset: 0 lastOffset: 2 count: 3 baseSequence: 0 lastSequence: 2 producerId: 7001 producerEpoch: 0 partitionLeaderEpoch: 9 isTransactional: false isControl: false deleteHorizonMs: OptionalLong.empty position: 0 CreateTime: 1711878013723 size: 87 magic: 2 compresscodec: none crc: 1713190284 isvalid: true

baseOffset: 3 lastOffset: 6 count: 4 baseSequence: 3 lastSequence: 6 producerId: 7001 producerEpoch: 0 partitionLeaderEpoch: 9 isTransactional: false isControl: false deleteHorizonMs: OptionalLong.empty position: 87 CreateTime: 1711878015016 size: 96 magic: 2 compresscodec: none crc: 361776245 isvalid: true

baseOffset: 7 lastOffset: 8 count: 2 baseSequence: 7 lastSequence: 8 producerId: 7001 producerEpoch: 0 partitionLeaderEpoch: 9 isTransactional: false isControl: false deleteHorizonMs: OptionalLong.empty position: 183 CreateTime: 1711878016979 size: 78 magic: 2 compresscodec: none crc: 125538935 isvalid: true

1.5.6 验证副本

分区复制的原理与普通的消费者客户端类似:跟随者broker会定期将上一个偏移量到当前偏移量之间的数据复制到磁盘上。如果复制过程停止,那么在重启之后将从上一个检查点继续复制。这个时候,如果之前复制的日志片段被删除,那么跟随者将不会填补这个缺口。

可以用kafka-replica-verification.sh来验证集群分区副本的一致性。它会从指定分区的副本读取消息,检查所有副本是否包含了相同的消息,并打印出指定分区的最大延迟。这个过程会一直重复,直到被取消。要使用这个工具,必须提供broker的连接串(如果有多个broker地址,就用逗号隔开)。在默认情况下,它会验证所有的主题。还可以用正则表达式匹配想要验证的主题。

kafka-replica-verification.sh --broker-list 172.26.143.96:9092 --topics-include 'peter.*'

2024-03-31 18:17:03,271: verification process is started

2024-03-31 18:17:33,383: max lag is 0 for partition peter-test-2-0 at offset 0 among 10 partitions

1.6 其他工具

kafka-acls.sh

kafka-mirror-maker.sh

1.7 不安全操作

移动集权控制器

移除待删除的主题

手动删除主题

2 编程方式

Only have the code now. This chapter to be completed...
示例代码