【无标题】Kafka 系列博文（一）：从零认识 Kafka，到底解决了什么问题？

大家好，这是我新开的 Kafka 系列博文第一篇。后面会按顺序写：核心概念、安装部署、Java 客户端使用、生产者/消费者原理、分区与副本、高可用、事务、性能调优等，日常工作遇到问题与解决思路。适合想系统学 Kafka 的后端同学。

一、Kafka 是什么？

简单一句话：

Kafka 是一个分布式、高吞吐、可持久化的消息队列/事件流平台。

主要能干三件事：

它不是单纯的 MQ，更像一个分布式事件总线，大数据、微服务、日志收集都离不开它。

二、为什么要用 Kafka？核心解决什么问题？

日常开发里，你大概率会遇到这些痛点：

Kafka 就是为这些场景设计的，核心优势：

三、Kafka 核心概念（必须记住）

刚入门先把这几个词搞懂，后面学起来不费劲：

Kafka 服务器节点，一个 Kafka 集群由多个 Broker 组成。

消息的分类，比如： user-login-log 、 order-create 。

生产者往 Topic 发，消费者从 Topic 读。

Topic 下面的分片，是 Kafka 高吞吐和扩展的关键。

发消息的一方。

读消息的一方。

一组消费者共同消费一个 Topic，同一个组内，一条消息只会被一个消费者消费。

用来实现：负载均衡 + 消息不重复处理。

分区内每条消息的序号，消费者靠它记录读到哪了。

四、Kafka 典型使用场景

下单成功→发消息→积分、通知、统计慢慢处理，不阻塞主流程。

秒杀/大促流量先进 Kafka，下游按能力慢慢消费，防止被打垮。

Nginx/应用日志→Kafka→ES/ClickHouse/Hive，统一日志链路。

MySQL binlog→Kafka→数仓/缓存更新，实现准实时数据同步。

Kafka + Flink/Faust 做实时推荐、实时大屏、风控计算。

五、本篇小结

这一篇我们先搭个框架：

下一篇我们就进入实操：