黑马头条 Kafka

我是南城余!阿里云开发者平台专家博士证书获得者!

欢迎关注我的博客!一同成长!

一名从事运维开发的worker,记录分享学习。

专注于AI,运维开发,windows Linux 系统领域的分享!

知识库链接:

黑马头条D1 · 语雀


参考文章:

【黑马头条之kafka及异步通知文章上下架】_黑马头条项目使用kafka的作用是什么-CSDN博客

黑马头条使用Kafka是为了实现文章管理端和APP端的文章状态(已发布、或点赞等数据量大的操作)进行及时性传递。

1. 消息中间件分类

2. Kafka安装

docker pull zookeeper:3.4.14
docker run -d --name zookeeper -p 2181:2181 zookeeper:3.4.14


docker pull wurstmeister/kafka:2.12-2.3.1

docker run -d --name kafka \
--env KAFKA_ADVERTISED_HOST_NAME=192.168.200.130 \
--env KAFKA_ZOOKEEPER_CONNECT=192.168.200.130:2181 \
--env KAFKA_ADVERTISED_LISTENERS=PLAINTEXT://192.168.200.130:9092 \
--env KAFKA_LISTENERS=PLAINTEXT://0.0.0.0:9092 \
--env KAFKA_HEAP_OPTS="-Xmx256M -Xms256M" \
--net=host wurstmeister/kafka:2.12-2.3.1

3. Kafka入门

设置多个组 可以满足一对多

4. Kafka分区

5. Kafka高可用设计

6. Kafka生产者

7. spring boot 集成kafka

在yml中同时配置序列化和反序列化(序列化在Java中,简单理解就是将对象转换为字节流,反序列化则相反,将字节流转化为Java对象)

8. Kafka的一些问题记录

8.1. kakfa的同步和异步有啥区别

同步会确认服务器的确认,确认完才能发送消息,异步则不需要!

在Apache Kafka中,同步(Synchronous)和异步(Asynchronous)通常是指生产者(Producer)发送消息到Kafka集群的方式。下面是它们的区别:

  1. 同步发送(Synchronous Sending):
    • 在同步发送中,生产者发送消息后会等待服务器的确认(acknowledgment)。
    • 生产者会等待直到收到对消息的确认,以确保消息已经成功写入Kafka集群的指定分区。
    • 这种方式可以提供更高的可靠性,因为生产者会等待直到Kafka确认接收到消息并将其写入至少一个分区。但同时,它可能会引入一些延迟,因为生产者需要等待确认。
  1. 异步发送(Asynchronous Sending):
    • 在异步发送中,生产者发送消息后不会等待服务器的确认,而是继续发送下一批消息。
    • 这种方式可以提供更高的吞吐量,因为生产者可以继续发送新消息而不必等待每个消息的确认。
    • 不过,这也意味着生产者不能立即得知消息是否成功写入Kafka。如果发生错误,可能需要通过回调函数或其他方式来处理。

选择同步还是异步发送取决于应用程序的需求和性能要求。同步发送通常用于对数据可靠性有更高要求的情况,而异步发送则适用于对延迟和吞吐量有更高要求的情况。在异步发送中,生产者可能需要实现一些方式来处理潜在的错误和重试机制,以确保消息最终被成功写入。

8.2. Kafka的分区,主题有啥区别

分区是物理上的,主题是逻辑上的,两者其实属于同一纬度,是人们为了更好的区分。

在Apache Kafka中,分区(Partition)和主题(Topic)是两个核心的概念,它们在消息传递和存储中起到关键作用。

  1. 主题(Topic):
    • 主题是消息发布和订阅的逻辑容器。它是一种逻辑概念,用于组织和分类消息。你可以将主题看作是消息的分类或主题的命名标识符。
    • 生产者将消息发送到特定的主题,而消费者则从特定的主题订阅消息。主题可以有多个订阅者,允许多个消费者独立地消费同一主题的消息。
    • 主题可以被配置为拥有多个分区,以便实现水平扩展和提高并行性。
  1. 分区(Partition):
    • 分区是主题的物理子集,每个分区是一个有序且不可变的消息序列。每个消息都属于一个特定的分区。
    • 分区允许Kafka在集群中并行处理和存储消息。它们是Kafka实现高吞吐量和水平扩展性的关键因素之一。
    • 每个分区在物理上存储在不同的地方,并且可以在不同的机器上。这有助于分散负载和提高容错性。
    • 消费者可以独立地从每个分区读取消息,这提高了并发性。

关键区别:

  • 主题(Topic)是逻辑概念,用于组织和分类消息;而分区(Partition)是主题的物理子集,用于实现水平扩展和并行处理。
  • 主题可以包含一个或多个分区,每个分区存储特定范围的消息。
  • 消费者订阅主题,但实际上消费者是从分区中读取消息的。

总体而言,主题提供了逻辑上的组织和分类,而分区则允许在分布式环境中高效地存储和处理消息。

相关推荐
RodrickOMG1 小时前
【大数据】Hadoop三节点集群搭建
大数据·hadoop·分布式
乄北城以北乀1 小时前
第1章 R语言中的并行处理入门
开发语言·分布式·r语言
customer082 小时前
【开源免费】基于SpringBoot+Vue.JS安康旅游网站(JAVA毕业设计)
java·vue.js·spring boot·后端·kafka·开源·旅游
得谷养人6 小时前
flink-1.16 table sql 消费 kafka 数据,指定时间戳位置消费数据报错:Invalid negative offset 问题解决
sql·flink·kafka
天乐敲代码6 小时前
Etcd静态分布式集群搭建
数据库·分布式·etcd
光纤传感技术研究7 小时前
分布式光纤传感|分布式光纤测温|线型光纤感温火灾探测器DTS|DTS|DAS|BOTDA的行业16年的总结【2024年】
分布式·dts·光纤传感器·botda·光纤传感技术
dbcat官方7 小时前
1.微服务灰度发布(方案设计)
java·数据库·分布式·微服务·中间件·架构
明达技术9 小时前
分布式 IO 模块助力冲压机械臂产线实现智能控制
分布式
溟洵10 小时前
【C++】异步(并发)实现 线程池 ---附源码+实现步骤(future、async、promise、package_task、任务池原理和框架)
服务器·网络·c++·分布式·后端