kafka

香吧香1 小时前
kafka
kafka 副本集设置和理解转载请注明出处:最近在做集群高可用验证的时候,遇到了一个kafka 副本集高可用的问题,在这里分析总结一下。
Rookie小强9 小时前
分布式·kafka
kafka的rebalance机制是什么
码农小灰1 天前
java·分布式·kafka
Kafka消息持久化机制全解析:存储原理与实战场景目录引言一、Kafka消息持久化的核心目标二、底层存储机制深度剖析1.【文件系统分层】——日志分组 + 日志段
Raisy_1 天前
大数据·数据仓库·kafka·flume
05 ODS层(Operation Data Store)ODS层在数据仓库中代表操作数据存储层(Operational Data Store),它是数据仓库架构的最底层,主要负责从源系统(如数据库、消息队列等)直接接入和存储原始数据,并进行初步清洗、格式转换和质量保证‌。
纪莫1 天前
java·分布式·后端·中间件·kafka·队列
Kafka如何保证「消息不丢失」,「顺序传输」,「不重复消费」,以及为什么会发生重平衡(reblanace)上一篇文章总结了kafka为什么快,下面来总结一下,kafka高频的常见的问题。内容有点多,全部看完需要有一定的耐心。
poemyang1 天前
kafka·高并发·pagecache·存储架构·顺序i/o·局部性原理
千亿消息“过眼云烟”?Kafka把硬盘当内存用的性能魔法,全靠这一手!Kafka 消息队列Apache Kafka是一个开源的分布式消息队列,由LinkedIn公司开发并于2011年贡献给Apache软件基金会。Kafka被设计用来处理千亿量级的实时数据,被广泛应用于互联网大规模数据处理平台中。
武子康1 天前
大数据·后端·kafka
大数据-75 Kafka 高水位线 HW 与日志末端 LEO 全面解析:副本同步与消费一致性核心AI炼丹日志-31- 千呼万唤始出来 GPT-5 发布!“快的模型 + 深度思考模型 + 实时路由”,持续打造实用AI工具指南!📐🤖
齐木卡卡西在敲代码2 天前
分布式·kafka
kafka的pull的依据绝对不需要! 提交 offset 和调用 poll() (拉取消息) 是两个完全独立的行为。消费者可以连续调用 poll() 多次,期间完全不提交任何 offset。 这是 Kafka 消费者的正常工作模式。
超级迅猛龙2 天前
数据库·hadoop·mysql·sqlserver·kafka·linq·cdc
保姆级Debezium抽取SQL Server同步kafkaDebezium SQL Server连接器捕获SQL Server数据库模式中发生的行级更改。官方2.0文档:
ejinxian2 天前
数据库·mysql·kafka
MySQL/Kafka数据集成同步,增量同步及全量同步业务库(MySQL)的数据要同步到数仓(HDFS),每天定时跑任务,实时业务(如订单Binlog)需要立刻同步到分析平台(Kafka),
武子康2 天前
大数据·后端·kafka
大数据-74 Kafka 核心机制揭秘:副本同步、控制器选举与可靠性保障AI炼丹日志-31- 千呼万唤始出来 GPT-5 发布!“快的模型 + 深度思考模型 + 实时路由”,持续打造实用AI工具指南!📐🤖
程序员不迷路2 天前
分布式·kafka
Kafka学习要精通 Kafka,需要深入理解其架构原理、核心组件、生产消费机制、运维调优及与业务系统的实战集成。以下是系统化的知识体系:
bing_1582 天前
分布式·kafka
kafka 生产者是如何发送消息的?Kafka 生产者发送消息的过程是一个异步流程,旨在实现高吞吐量和可靠性。这个过程主要涉及两个核心线程:主线程和 Sender 线程。
纪莫3 天前
kafka
Kafka如何保证「消息不丢失」,「顺序传输」,「不重复消费」,以及为什么会发送重平衡(reblanace)上一篇文章总结了kafka为什么快,下面来总结一下,kafka高频的常见的问题。内容有点多,全部看完需要有一定的耐心。
BD_Marathon3 天前
分布式·kafka
Kafka文件存储机制Topic是逻辑上的概念,而partition是物理上的概念,每个partition对应于一个log文件,该log文件中存储的就是Prodcuer生产的数据,Producer生产的数据会被不断追加到该log文件末端,为防止log文件过大导致数据定位效率低下,Kafka采取了分片和索引机制,将每个partition分为多个segment,每个segment包括:".index文件"、".log"文件和.timeindex等文件,这些文件位于一个文件夹下,该文件夹的命名规则为:topic名称+分区序号,例如f
Aspirin_Slash3 天前
kafka
docker-compose部署kafka with kraft 配置内网公网同时访问使用docker部署kafka broker,同时需要内网和公网同时访问,公司内网通过内网端口访问,外部通过公网端口访问。同时配置kafka通过SASL_PLAINTEXT认证。
君不见,青丝成雪3 天前
数据库·redis·kafka
大数据技术栈 —— Redis与Kafka什么是缓存使用场景用作DB缓存session分离分布式锁乐观锁三种读写模式redis介绍淘汰策略expire原理
Fireworkitte4 天前
分布式·kafka·ar
Kafka的ISR、OSR、AR详解Kafka中的ISR、OSR和AR是副本管理机制的核心概念,它们共同保障了Kafka的高可用性和数据一致性。下面我将详细解释这些概念及其相互关系。
Fireworkitte4 天前
kafka·apache
org.apache.kafka.clients 和 org.springframework.kafka 的区别这两个包都是用于与Kafka交互的Java库,但它们属于不同的层次和生态系统,主要区别如下:使用原生客户端 当:
yh云想6 天前
分布式·kafka
《从入门到精通:Kafka核心原理全解析》在当今的分布式系统中,消息队列扮演着至关重要的角色,而 Kafka 无疑是其中的佼佼者。它以高吞吐量、高可靠性和低延迟的特性,成为了日志收集、数据同步、实时计算等场景的首选工具。本文将从最基础的概念讲起,逐步深入 Kafka 的核心原理、操作实践和高级特性,助你从入门到精通 Kafka。