kafka优化

在生产环境中,有一个flink任务消费速度迟迟上不去,后面定位到是发送kafka的速度比较慢。这里是封装的代码:

java 复制代码
public void sendDelayMessage(String topic, String value, Time delayTime) {
        //boolean isFlush = false;
        boolean printLogs = false;
        try {
            ProducerRecord<String, String> producerRecord = new ProducerRecord(topic, value);
            producerRecord.headers().add("x-delay", String.valueOf(delayTime.toMilliseconds()).getBytes());
            producerRecord.headers().add("x-event", String.valueOf(System.currentTimeMillis()).getBytes());
            if (printLogs) {
                this.producer.send(producerRecord, (metadata, exception) -> {
                    log.info("kafkamessage: {}.", metadata.toString());
                });
            } else {
                this.producer.send(producerRecord);
            }

            if (isFlush) {
                this.producer.flush();
            }
        } catch (Exception var6) {
            var6.printStackTrace();
            log.error("producer exception,topic {},msg:{}, send kafka exception {}", new Object[]{topic, value, var6});
        }

    }

后面我把isFlush改成false,让它不走isflush,这样就不会被同步阻塞了,大大提升了发送效率。

flush() 方法的主要作用

强制将 KafkaProducer 缓冲区中的所有消息立即发送到 Kafka 集群,并且等待这些消息的确认。它用于确保消息被发送,并在需要时同步确认发送结果。具体来说,它有以下几个作用:

1. 刷新消息缓冲区

KafkaProducer 会把待发送的消息缓存在内存中,而不是每条消息都立即发送到 Kafka Broker。当你调用 flush() 时,它会强制将这些消息立即发送出去,并等待 Kafka Broker 的确认。

2. 同步等待消息确认

flush() 会使 send() 方法的异步操作变为同步操作。它会等待所有缓存的消息成功发送并确认,才能继续执行后续操作。如果发送过程中发生异常,flush() 会抛出错误。这个过程会使得应用程序阻塞,直到消息成功发送。

3. 确保消息发送完成

flush() 用来确保所有的消息已经发送到 Kafka 集群,并且所有的消息都已被 Kafka 确认。这对于确保消息在程序退出或关键操作前被可靠发送非常重要。

使用场景

  1. 程序结束时 :在应用程序退出之前调用 flush(),确保所有消息都已成功发送到 Kafka,防止消息丢失。

  2. 写入操作后 :如果你希望在发送特定消息后立即确保其成功发送并确认,可以在发送消息后调用 flush()

flush() 阻塞的原因

flush() 的作用是强制 KafkaProducer 将所有缓存在内部的消息立即发送到 Kafka 集群,并等待发送确认。如果你每次调用 flush() 都会等待消息被确认,这会导致以下影响:

  • 阻塞发送 :每次发送消息后,flush() 会阻塞直到所有的消息被成功发送并确认。这意味着发送消息的速度会受到网络延迟、Kafka Broker 负载以及消息确认的时间的影响。

  • 同步操作flush() 是一个同步操作,因此它会导致发送线程暂停,直到消息成功发送到 Kafka 服务器并得到确认。这可能会导致数据发送过程变慢,尤其是在发送大量消息时。

kafka发送过程

相关推荐
雨辰AI40 分钟前
SpringBoot3 + 人大金仓读写分离 + 分库分表 + 集群高可用 全栈实战
java·数据库·mysql·政务
长城20241 小时前
关于MySql的ONLY_FULL_GROUP_BY问题
数据库·mysql·聚合列
常常有1 小时前
MySQL 底层执行原理:输入SQL语句到两阶段提交
数据库·sql·mysql
Mr. zhihao2 小时前
深入解析redis基本数据结构
数据结构·数据库·redis
m0_748839492 小时前
利用天正暖通CAD快速掌握风管数量统计的方法
数据库
随身数智备忘录2 小时前
什么是设备管理体系?设备管理体系包含哪些核心模块?
网络·数据库·人工智能
海市公约2 小时前
MySQL更新语句执行全流程:从Buffer Pool修改到二阶段提交
数据库·mysql·binlog·innodb·undo log·二阶段提交·update执行原理
颂love3 小时前
MySQL的执行流程
android·数据库·mysql
程序leo源3 小时前
Qt窗口详解
开发语言·数据库·c++·qt·青少年编程·c#
这个DBA有点耶3 小时前
COUNT进阶:超大表的近似计数与HyperLogLog
数据库·sql·程序人生·学习方法·dba·改行学it