Kafka3.0.0版本——文件存储机制

这里写木目录标题

    • [一、Topic 数据的存储机制](#一、Topic 数据的存储机制)
      • [1.1、Topic 数据的存储机制的概述](#1.1、Topic 数据的存储机制的概述)
      • [1.2、Topic 数据的存储机制的图解](#1.2、Topic 数据的存储机制的图解)
      • [1.3、Topic 数据的存储机制的文件解释](#1.3、Topic 数据的存储机制的文件解释)
    • 二、Topic数据的存储位置示例

一、Topic 数据的存储机制

1.1、Topic 数据的存储机制的概述

  • Topic是逻辑上的概念,而partition是物理上的概念。
  • 每个partition对应于一个log文件,该log文件中存储的就是Producer生产的数据。
  • Producer生产的数据会被不断追加到该log文件末端,为防止log文件过大导致数据定位效率低下,Kafka采取了 分片和 索引机制。将每个partition分为多个segment。
  • 每个segment包括:".index"文件、".log"文件和.timeindex等文件。这些文件位于一个文件夹下,该文件夹的命名规则为:topic名称+分区序号,例如:news-0。

1.2、Topic 数据的存储机制的图解

1.3、Topic 数据的存储机制的文件解释

  • Topic 数据的存储机制的文件解释

    文件格式 解释
    .log 日志文件
    .index 偏移量索引文件
    .timeindex 时间戳索引文件
    其他文件

二、Topic数据的存储位置示例

  • 启动生产者,并发送消息。

    java 复制代码
    bin/kafka-console-producer.sh  --bootstrap-server 192.168.136.27:9092 --topic threetopic
  • 查看四台服务器的/opt/module/kafka/datas/threetopic-0(threetopic-1、threetopic-2、threetopic-3)路径上的文件。

  • 通过工具查看 index和 log信息。

    java 复制代码
    kafka-run-class.sh kafka.tools.DumpLogSegments --files 00000000000000000000.log
相关推荐
编程彩机1 小时前
互联网大厂Java面试:从消息队列到微服务架构场景解析
kafka·消息队列·分布式事务·微服务架构·java面试
Prince-Peng1 小时前
技术架构系列 - 详解Kafka
分布式·中间件·架构·kafka·零拷贝·消息中间件·填谷削峰
susu108301891118 小时前
docker启动kafka
docker·容器·kafka
麦兜*1 天前
深入解析云原生时代的高性能消息中间件:基于Apache Pulsar与Kafka架构对比的万亿级数据吞吐与低延迟实时处理实战
云原生·kafka·apache
DolphinScheduler社区1 天前
Linux 环境下,Apache DolphinScheduler 如何驱动 Flink 消费 Kafka 数据?
linux·flink·kafka·开源·apache·海豚调度·大数据工作流调度
编程彩机2 天前
互联网大厂Java面试:从Spring Security到微服务架构场景解析
kafka·spring security·微服务架构·jwt·java面试·分布式追踪
麦兜和小可的舅舅2 天前
ClickHouse Drop Table On Cluster 故障分析和原理解析
clickhouse·kafka
小程故事多_802 天前
深度解析Kafka重平衡,触发机制、执行流程与副本的核心关联
分布式·kafka
【赫兹威客】浩哥2 天前
【赫兹威客】伪分布式Kafka测试教程
分布式·kafka
Jackyzhe2 天前
从零学习Kafka:集群架构和基本概念
学习·架构·kafka