kafka简介

菜鸡儿齐2025-10-30 23:22

Kafka 是一款由 Apache 软件基金会开发的分布式流处理平台，主要用于高吞吐量的实时数据管道构建、流式数据分析及跨系统集成。其核心特性包括持久化存储、水平扩展和容错机制。

核心概念

主题（Topic）

消息的分类单元，生产者将消息发送到特定主题，消费者订阅主题进行消费。
分区（Partition）

每个主题分为多个分区，分区是消息的有序队列，物理上对应一个文件夹，支持水平扩展。
副本（Replica）

分区的副本分布在集群不同节点，通过冗余提升可用性。
分段（segment）

宏观上看，（一个partition对应一个日志）。由于生产者生产的消息会不断追加到log文件末尾，为防止log文件过大导致数据检索效率低下，kafka采取分段和索引机制，将每个partition分为多个segment，同时也便于消息的维护和清理。

核心组件

生产者（Producer）：发布消息到主题。
消费者（Consumer）：订阅主题并处理数据流。
代理（Broker）：Kafka 集群中的服务器节点，负责消息存储和转发。

应用场景

实时数据管道：如日志收集、大数据传输。
流式处理：电商订单处理、金融交易监控。

与其他消息队列对比

Kafka：高吞吐、持久化存储，适合海量数据场景。
RabbitMQ：低延迟、复杂路由，适合中小规模系统。
RocketMQ：金融级事务支持，如订单一致性。

参考：Kafka 官方文档或入门教程。

上一篇：Vue3 + Element Plus 实现前端手动分页

下一篇：《解决界面交互痛点：WaterFlow 瀑布流、双层嵌套滚动、键盘避让与跨 Ability 跳转实践》

热门推荐

01GitHub 镜像站点 02如何新建文件夹？电脑新建文件夹的4种方法 03国内可直接用、免费额度/永久免费的大模型API清单（含 SiliconFlow、火山、阿里、智谱、百度、Kimi、DeepSeek、DMXAPI 等）042026年7月AI圈大地震：GPT-5.6被政府限制、Claude入驻Slack、Anthropic自研芯片 05微信历史版本含下载地址（ Windows PC | 安卓 | MAC ）及设置微信不更新 062026 国产 AI 大模型横评：DeepSeek、通义千问、Kimi、文心一言、星火、豆包谁更能打？07AI 编程 IDE 全景解析 2026：Agent 全面接管开发链路 08Agnes AI 免费 API 接入指南：文本、生图、生视频，一套接口全免费 09AI科技热点日报 | 2026年07月01日 102026 年 AI 大模型 & AI 编程工具实战全总结