Kafka生产者 - 技术栈

1.acks

如果acks=0，生产者在成功写入消息之前不会等待任何来自服务器的响应。
- 缺点：如果当中出现了问题，导致服务器没有收到消息，那么生产者就无从得知，消息就丢失了
- 优点：因为生产者不需要等待服务器的响应，所有他可以以网络能够支持的最大速度发送消息，从而达到很高的吞吐量
如果acks=1，只要集群的leader节点收到消息，生产者就会收到一个来自服务器的成功响应
- 如果无法到达首领节点（如leader节点崩溃，新的leader还没有被选举出来），生产者会收到一个错误响应，为避免数据丢失，生产者会重发消息
如果acks=all，只有当所有参与复制的节点全部收到消息，生产者才会收到一个来自服务器的成功响应
- 优点：最安全，保证不止一个服务器收到消息，就算有服务器发生崩溃，整个集群仍可以运行
- 缺点：延迟比acks=1更高

2.buffer.memory

该参数用来设置生产者内存缓冲区的大小，生产者用它缓冲要发送到服务器的消息。如果应用程序发送消息的速度超过发送到服务器的速度，导致生产者空间不足，send()方法调用要么被阻塞，要么抛出异常

3.compression.type

4.retries

5.batch.size

当有多个消息需要被发送到同一个分区时，生产者会把他们放在同一个批次里。该参数指定了一个批次可以使用的内存大小
- 如果设置的很大，也不会造成延迟，半满或者只包含一个消息的批次也有可能被发送
- 设置的太小，生产者需要更频繁地发送消息，会增加一些额外开销

8.max.in.flight.requests.per.connection

9.max.request.size

10.kafka保证同一个分区里的消息是有序的，消费者会按照生产者的插入顺序进行读取

如果某些场景要求消息是有序的，那么消息是否写入成功是很关键的，不要把retries设为0，可以把max.in.flight.requests.per.connection设为1，这样生产者尝试发送第一批消息时，就不会有其他的消息发送给broker

缺点：严重影响生产者的吞吐量

优点：消息严格有序