kafka学习笔记--生产者消息发送及原理

本文内容来自尚硅谷B站公开教学视频,仅做个人总结、学习、复习使用,任何对此文章的引用,应当说明源出处为尚硅谷,不得用于商业用途。

如有侵权、联系速删

视频教程链接:【尚硅谷】Kafka3.x教程(从入门到调优,深入全面)

发送的目的就一个,将消息发到kafka集群里,整体流程如下:

如上图,首先要有一个发送消息的主线程,也就是main线程,然后有一个读取数据的线程sender,所有的消息先经过拦截器(一般不用,因为大数据体系中,使用flume充当拦截器更加方便),然后抵达序列化器,最后抵达分区器,然后发送消息

为什么一般不用Java的序列化器?

Java的序列化过于笨重,一条消息要附带很多比如安全等功能的额外信息,大数据场景下,这些额外信息的负担太重,通常在spark、flink等框架中我们会自己实现序列化

分区器会在内存中,为每一个kafka分区创建一个双端队列,方便消息的管理,分区器大小为默认32M,每个队列在数据达到16k时,由sender线程读取,当然长时间达不到16k数据的队列,也会每隔一段时间(默认0ms)发送一次,采用默认策略则意味着每条消息都发送,在大数据场景下,应当灵活调整

队列数据累加上限的参数与等待发送时长的两个参数为:batch.size,linger.ms

这里其实是创建了一个32M大小的临时内存池,数据添加到队列就是内存池分配内存的过程,发送成功后清理数据,就是内存回归到内存池的过程

达到拉取条件(16k或时长)的数据,sender线程会主动从分区器内存空间中拉取数据,为每一个节点创建一个请求队列,队列中最多等待5个请求,发送到kafka集群,kafka给予应答回应

如果发送成功,则关闭、清理该请求,同时清理掉分区器队列中相应的数据

如果发送失败,则重试发送,直到重试到设定的次数为止(默认重试次数为int最大值)

应答级别分三种:

0:生产者发来的消息立即应答,不需要等到落盘

1:生产者发来的消息,等到leader收到数据后应答

-1:生产者发来的消息,等到leader和备份的所有节点都收到再应答

相关推荐
再睡一夏就好几秒前
【排序算法】⑥快速排序:Hoare、挖坑法、前后指针法
c语言·数据结构·经验分享·学习·算法·排序算法·学习笔记
森林古猿110 分钟前
论区间dp:常用模型(附极角排序教程)
c++·学习·算法·排序算法·动态规划·几何学
freed_Day18 分钟前
Java进阶学习之不可变集合
java·学习
开航母的李大20 分钟前
腾讯云terraform学习教程
学习·腾讯云·terraform
丰锋ff2 小时前
计算机网络摘星题库800题笔记 第4章 网络层
网络·笔记·计算机网络
草莓熊Lotso3 小时前
【C语言强化训练16天】--从基础到进阶的蜕变之旅:Day2
c语言·经验分享·笔记·其他
针不戳202209263 小时前
PFC是什么
嵌入式硬件·学习·硬件工程
文火冰糖的硅基工坊4 小时前
[激光原理与应用-226]:机械 - 如何学习3D图设计
学习·3d·系统架构·公司·机械·结构
firshman_start5 小时前
SQL注入学习笔记
sql·学习
草莓熊Lotso5 小时前
《吃透 C++ 类和对象(上):封装、实例化与 this 指针详解》
开发语言·c++·经验分享·笔记·其他