第1章：Kafka简介

学习内容：

了解为什么使用 Kafka

关于大数据和消息系统的常见误区

帮助推动消息传递、流媒体和物联网数据处理的实时事件用例

Kafka 定义为一个分布式流媒体平台，它主要有三个功能

Kafka 的消息传递至少可以采用以下三种交互方式

至少一次语义，在这种情况下，可以将Kafka配置为允许消息生产者多次发送相同的消息，并确保消息写入代理。如果消息未收到确认已写入代理，生产者可以重新发送消息。对于那些不可错过的消息，例如有人支付了发票，这种保证可以在消费者端进行一些过滤，但这是安全传递方式之一

至多一次语义是指消息生产者可能只发送一次消息，不会重试。发生故障时，生产者会继续推进，而不是尝试重新发送该消息。

为什么有人会对丢失一条消息感到无所谓？例如，网站在跟踪访客页面浏览量时，可能会认为在处理数百万个页面浏览事件中丢失几个消息是可以接受的。保持系统高效运行，而不是等待确认，可能会带来超时丢失数据的成本

准确的一次性语义在很多用例中是理想的，这似乎是一个合理的保证，可以消除重复消息，让重复消息成为过去式。但是，大多数开发者都希望在消费端发送一条消息，并接收同样的消息

我们以一个 HR 系统为例。员工可以在系统中提交带薪假期申请；如果你习惯用 CRUD 系统来理解，假期申请的提交不仅会由薪资部门处理，还可能用于项目计划，以预测工作进展。

你会把这两个应用联系在一起吗？如果薪资系统出现故障，会影响预测工具的可用性吗？

而使用 Kafka 可以将一些旧设计中紧密相连的应用程序分离开来，让您的数据接口变成 Kafka，而不是众多的 API 和数据库