Kafka3.0.0版本——文件存储机制

这里写木目录标题

    • [一、Topic 数据的存储机制](#一、Topic 数据的存储机制)
      • [1.1、Topic 数据的存储机制的概述](#1.1、Topic 数据的存储机制的概述)
      • [1.2、Topic 数据的存储机制的图解](#1.2、Topic 数据的存储机制的图解)
      • [1.3、Topic 数据的存储机制的文件解释](#1.3、Topic 数据的存储机制的文件解释)
    • 二、Topic数据的存储位置示例

一、Topic 数据的存储机制

1.1、Topic 数据的存储机制的概述

  • Topic是逻辑上的概念,而partition是物理上的概念。
  • 每个partition对应于一个log文件,该log文件中存储的就是Producer生产的数据。
  • Producer生产的数据会被不断追加到该log文件末端,为防止log文件过大导致数据定位效率低下,Kafka采取了 分片和 索引机制。将每个partition分为多个segment。
  • 每个segment包括:".index"文件、".log"文件和.timeindex等文件。这些文件位于一个文件夹下,该文件夹的命名规则为:topic名称+分区序号,例如:news-0。

1.2、Topic 数据的存储机制的图解

1.3、Topic 数据的存储机制的文件解释

  • Topic 数据的存储机制的文件解释

    文件格式 解释
    .log 日志文件
    .index 偏移量索引文件
    .timeindex 时间戳索引文件
    其他文件

二、Topic数据的存储位置示例

  • 启动生产者,并发送消息。

    java 复制代码
    bin/kafka-console-producer.sh  --bootstrap-server 192.168.136.27:9092 --topic threetopic
  • 查看四台服务器的/opt/module/kafka/datas/threetopic-0(threetopic-1、threetopic-2、threetopic-3)路径上的文件。

  • 通过工具查看 index和 log信息。

    java 复制代码
    kafka-run-class.sh kafka.tools.DumpLogSegments --files 00000000000000000000.log
相关推荐
明明跟你说过7 小时前
Kafka 与 Elasticsearch 的集成应用案例深度解析
大数据·elk·elasticsearch·kafka·big data·bigdata
lifewange9 小时前
Nginx + Kafka 可编程精细控制 完整版(可直接落地运行)
运维·nginx·kafka
数据库小学妹15 小时前
CDC实时数据同步:让数据库变更秒级流向大数据平台!
大数据·数据库·mysql·kafka·dba
虎头金猫15 小时前
Beszel 轻量服务器监控:多台服务器状态统一看,搭起来比 Prometheus 省事太多
linux·运维·服务器·分布式·kafka·开源·prometheus
liux352816 小时前
Kafka 4.1.1 生产环境调优与最佳实践指南
数据库·分布式·kafka
Devin~Y16 小时前
大厂Java面试实录:Spring Boot + JVM + Redis/Kafka + 微服务治理 + Spring AI/RAG 一条龙
java·jvm·spring boot·redis·spring cloud·kafka·openfeign
老码观察18 小时前
数环通消息中间件选型实录:RocketMQ vs Kafka vs RabbitMQ,我们为什么选了RocketMQ
kafka·rabbitmq·rocketmq
huaiixinsi18 小时前
Canal + Outbox、Kafka 选型与高可用、Caffeine 底层原理总结
java·数据库·分布式·mysql·spring·adb·kafka
许长安18 小时前
Kafka 架构讲解:从提交日志到分区副本机制
c++·经验分享·笔记·分布式·架构·kafka
菜鸟小九18 小时前
Kafka()
分布式·kafka