在生产环境中,有一个flink任务消费速度迟迟上不去,后面定位到是发送kafka的速度比较慢。这里是封装的代码:
java
public void sendDelayMessage(String topic, String value, Time delayTime) {
//boolean isFlush = false;
boolean printLogs = false;
try {
ProducerRecord<String, String> producerRecord = new ProducerRecord(topic, value);
producerRecord.headers().add("x-delay", String.valueOf(delayTime.toMilliseconds()).getBytes());
producerRecord.headers().add("x-event", String.valueOf(System.currentTimeMillis()).getBytes());
if (printLogs) {
this.producer.send(producerRecord, (metadata, exception) -> {
log.info("kafkamessage: {}.", metadata.toString());
});
} else {
this.producer.send(producerRecord);
}
if (isFlush) {
this.producer.flush();
}
} catch (Exception var6) {
var6.printStackTrace();
log.error("producer exception,topic {},msg:{}, send kafka exception {}", new Object[]{topic, value, var6});
}
}
后面我把isFlush改成false,让它不走isflush,这样就不会被同步阻塞了,大大提升了发送效率。
flush() 方法的主要作用
强制将 KafkaProducer 缓冲区中的所有消息立即发送到 Kafka 集群,并且等待这些消息的确认。它用于确保消息被发送,并在需要时同步确认发送结果。具体来说,它有以下几个作用:
1. 刷新消息缓冲区
KafkaProducer 会把待发送的消息缓存在内存中,而不是每条消息都立即发送到 Kafka Broker。当你调用 flush() 时,它会强制将这些消息立即发送出去,并等待 Kafka Broker 的确认。
2. 同步等待消息确认
flush() 会使 send() 方法的异步操作变为同步操作。它会等待所有缓存的消息成功发送并确认,才能继续执行后续操作。如果发送过程中发生异常,flush() 会抛出错误。这个过程会使得应用程序阻塞,直到消息成功发送。
3. 确保消息发送完成
flush() 用来确保所有的消息已经发送到 Kafka 集群,并且所有的消息都已被 Kafka 确认。这对于确保消息在程序退出或关键操作前被可靠发送非常重要。
使用场景
-
程序结束时 :在应用程序退出之前调用
flush(),确保所有消息都已成功发送到 Kafka,防止消息丢失。 -
写入操作后 :如果你希望在发送特定消息后立即确保其成功发送并确认,可以在发送消息后调用
flush()。
flush() 阻塞的原因
flush() 的作用是强制 KafkaProducer 将所有缓存在内部的消息立即发送到 Kafka 集群,并等待发送确认。如果你每次调用 flush() 都会等待消息被确认,这会导致以下影响:
-
阻塞发送 :每次发送消息后,
flush()会阻塞直到所有的消息被成功发送并确认。这意味着发送消息的速度会受到网络延迟、Kafka Broker 负载以及消息确认的时间的影响。 -
同步操作 :
flush()是一个同步操作,因此它会导致发送线程暂停,直到消息成功发送到 Kafka 服务器并得到确认。这可能会导致数据发送过程变慢,尤其是在发送大量消息时。
kafka发送过程




