Kafka如何避免重复消费

一、重复消费的根本原因

核心：offset 提交时机和消息处理完成不同步

自动提交 offset（默认）

消费者定时自动提交位移，还没处理完消息就提交了。若此时消费者宕机/重启，会从上一次已提交 offset 之后重新拉取，造成重复。
手动提交 offset 失败/超时

业务逻辑执行成功，但网络问题、客户端异常导致 offset 提交失败，重启后重消费。
消费者再均衡（Rebalance）

组内上下线、分区重分配，未提交 offset 的分区会被其他消费者接管，重新消费。
生产者重试

生产者发送消息超时，重试投递，服务端存多条相同消息。
客户端手动回滚 offset

人为将位移调回之前位置，主动触发重复消费。

二、主流语义与对应方案

Kafka 消息投递三种语义：

• At Most Once（最多一次）：可能丢消息，不会重复

• At Least Once（至少一次）：可能重复，不会丢消息（Kafka 默认）

• Exactly Once（精确一次）：不丢、不重复（业务最终唯一）

逻辑：先提交 offset，再处理消息

• 流程：拉取消息 → 立即提交 offset → 执行业务

• 问题：提交完宕机，业务没执行，消息丢失

• 适用：对数据丢失不敏感的场景

逻辑：先处理消息，成功后再提交 offset

• 关闭自动提交，使用手动提交 offset

• 流程：拉取消息 → 执行业务逻辑 → 全部成功 → 手动提交 offset

• 特点：保证消息不丢失，但依然会出现重复消费，需业务兜底

Java 关键配置

关闭自动提交

enable.auto.commit = false

分两类：Kafka 原生事务 + 业务幂等（生产环境最常用组合）

方案一：业务层做幂等（推荐，成本最低）

不管消息重复多少次，多次执行结果和执行一次完全一致。

常用实现方式：

适用于 Kafka 内部流转（topic→topic）、流式计算场景。