kafka优化

在生产环境中,有一个flink任务消费速度迟迟上不去,后面定位到是发送kafka的速度比较慢。这里是封装的代码:

java 复制代码
public void sendDelayMessage(String topic, String value, Time delayTime) {
        //boolean isFlush = false;
        boolean printLogs = false;
        try {
            ProducerRecord<String, String> producerRecord = new ProducerRecord(topic, value);
            producerRecord.headers().add("x-delay", String.valueOf(delayTime.toMilliseconds()).getBytes());
            producerRecord.headers().add("x-event", String.valueOf(System.currentTimeMillis()).getBytes());
            if (printLogs) {
                this.producer.send(producerRecord, (metadata, exception) -> {
                    log.info("kafkamessage: {}.", metadata.toString());
                });
            } else {
                this.producer.send(producerRecord);
            }

            if (isFlush) {
                this.producer.flush();
            }
        } catch (Exception var6) {
            var6.printStackTrace();
            log.error("producer exception,topic {},msg:{}, send kafka exception {}", new Object[]{topic, value, var6});
        }

    }

后面我把isFlush改成false,让它不走isflush,这样就不会被同步阻塞了,大大提升了发送效率。

flush() 方法的主要作用

强制将 KafkaProducer 缓冲区中的所有消息立即发送到 Kafka 集群,并且等待这些消息的确认。它用于确保消息被发送,并在需要时同步确认发送结果。具体来说,它有以下几个作用:

1. 刷新消息缓冲区

KafkaProducer 会把待发送的消息缓存在内存中,而不是每条消息都立即发送到 Kafka Broker。当你调用 flush() 时,它会强制将这些消息立即发送出去,并等待 Kafka Broker 的确认。

2. 同步等待消息确认

flush() 会使 send() 方法的异步操作变为同步操作。它会等待所有缓存的消息成功发送并确认,才能继续执行后续操作。如果发送过程中发生异常,flush() 会抛出错误。这个过程会使得应用程序阻塞,直到消息成功发送。

3. 确保消息发送完成

flush() 用来确保所有的消息已经发送到 Kafka 集群,并且所有的消息都已被 Kafka 确认。这对于确保消息在程序退出或关键操作前被可靠发送非常重要。

使用场景

  1. 程序结束时 :在应用程序退出之前调用 flush(),确保所有消息都已成功发送到 Kafka,防止消息丢失。

  2. 写入操作后 :如果你希望在发送特定消息后立即确保其成功发送并确认,可以在发送消息后调用 flush()

flush() 阻塞的原因

flush() 的作用是强制 KafkaProducer 将所有缓存在内部的消息立即发送到 Kafka 集群,并等待发送确认。如果你每次调用 flush() 都会等待消息被确认,这会导致以下影响:

  • 阻塞发送 :每次发送消息后,flush() 会阻塞直到所有的消息被成功发送并确认。这意味着发送消息的速度会受到网络延迟、Kafka Broker 负载以及消息确认的时间的影响。

  • 同步操作flush() 是一个同步操作,因此它会导致发送线程暂停,直到消息成功发送到 Kafka 服务器并得到确认。这可能会导致数据发送过程变慢,尤其是在发送大量消息时。

kafka发送过程

相关推荐
大郭鹏宇7 小时前
MongoDB快速实战与基本原理入门
数据库·mongodb
KASH_SHADOW7 小时前
8-Mysql的安装与配置
数据库·mysql·adb
澈2077 小时前
【无标题】QT入门第十二天:数据库编程(下)模型视图与数据展示 | 零基础学QT
数据库·qt·oracle
云絮.7 小时前
数据库事务
java·开发语言·数据库
Leon-Ning Liu8 小时前
【真实经验分享】OGG抽取进程报错 ORA-07445 [kgherrordmp()+986] ORA-00600 [17114]分析步骤
运维·数据库
CCPC不拿奖不改名8 小时前
Redis 工程化部署深度解析
linux·服务器·数据库·redis·深度学习·缓存·rag
swg3213218 小时前
Kafka基于ZK和KRaft的设计原理与差异
分布式·kafka
吴声子夜歌8 小时前
SQL进阶——自连接
数据库·sql
云贝教育-郑老师9 小时前
TDSQL(MySQL版)分布式事务实现机制深度解析:从两阶段提交到全局一致性读
数据库·sql