聊聊kafka client性能调优及kafka最佳实践

这里是weihubeats ,觉得文章不错可以关注公众号小奏技术,文章首发。拒绝营销号,拒绝标题党

背景

最近在使用kafka的时候遇到了一些性能问题。

所以就打算研究下kafka相关的性能优化方案。

client主要分两个

  • producer
  • consumer

producer

producer主要是有两个核心参数

batch.size

先说说这个参数吧 batch.sizeproducer的参数。

当多条消息发送到相同分区时,producer就会将消息打包到一起,然后一次性批量发送到kafka。减少网络请求

默认到小是1638416kb

默认值其实是偏小的,所以我们最好设置为更大。

batch.size 设置的越大,吞吐就越大,但是延迟也会越大

linger.ms

我们设想一下,如果要发送的消息一直达不到我们的batch.size怎么办呢?

难道消息一直不发送吗?

这里就推出第二个参数linger.ms。表示batch的超时时间。

如果linger.ms时间内batch.size还没达到的话,消息也会直接发送。

该值越大,吞吐越大、但延迟也会越大

consumer

consumer这边的核心参数就是fetch.min.bytes,默认值是1kb

Kafka Broker端积只要积攒了1kb 的数据,就可以返回给 Consumer

然后就是一个fetch.max.wait.msproducerlinger.ms类似。指定broker最大等待时间,默认500ms

kafka最佳实践

实际早在国外Hortonworks就总结了一些kafka的最佳实践,虽然文章时间久远,但是依旧很有参考价值

总结

其实可以看到producerbatch.sizelinger.ms就是借鉴了tcp/ip的网络发送算法。

tcp/ipNagle算法大致的规则如下

  1. 如果包长度达到MSS,则允许发送
  2. 如果包含FIN,则允许发送
  3. 如果设置了TCP_NODELAY,则允许发送
  4. 未设置TCP_CORK选项时,若所有发出去的小数据包(包长度小于MSS)均被确认,则允许发送
  5. 上述条件都未满足,但发生了超时(一般为200ms),则立即发送。
vbnet 复制代码
if there is new data to send then
    if the window size ≥ MSS and available data is ≥ MSS then
        send complete MSS segment now
    else
        if there is unconfirmed data still in the pipe then
            enqueue data in the buffer until an acknowledge is received
        else
            send data immediately
        end if
    end if
end if

总得来说主要是四个参数

producer:

consumer:

实际还有很多参数也需要配置,在kafka最佳实践里面都有一些说明,这里就不过多介绍了

相关推荐
GoGeekBaird5 小时前
从 Prompt Engineering 到 Loop Engineering,我觉得 AI 开发这事儿终于开始变味了
后端·github
一条泥憨鱼5 小时前
【Redis】数据类型和常用命令
java·数据库·redis·后端·缓存
Oneslide6 小时前
初始化微信小程序
后端
hboot7 小时前
AI工程师第一课 - Python
前端·后端·python
阿正的梦工坊7 小时前
【Rust】12-借用检查器与非词法生命周期
开发语言·后端·rust
飞天狗1118 小时前
零基础JavaWeb入门——第2课:让网页“活”起来 —— JSP是什么?
java·开发语言·前端·后端·web
梦@_@境9 小时前
面向 Spring Boot 的可观测业务流程编排引擎
java·spring boot·后端
JAVA面经实录9179 小时前
Netty 全套系统化学习文档(零基础到高阶面试完整版)
java·后端
GetcharZp9 小时前
C++ 程序员的终极减负:仅需一个头文件,优雅搞定 HTTP 客户端与服务端
后端
IT_陈寒10 小时前
Python的pickle让我半夜加班,这破玩意儿太坑了
前端·人工智能·后端