Kafka的死信队列

死信队列(Dead-Letter Queue,DLQ)就是消息的"太平间" ------

正常队列里"死掉"的消息,统一拉到这儿来,方便后续排查、重试或人工干预,而不是直接扔掉。


一、消息是怎么"死"的

  1. 重试次数用尽

    消费失败,系统重投 3~5 次仍报错 → 认为"救不活"。

  2. TTL 过期

    消息在队列里待的时间超过设定的存活期(Time-To-Live)。

  3. 队列长度超限

    队列满,最早的消息被"挤"出来。

  4. 手动否定

    业务代码明确 basic.reject / basic.nackrequeue=false


二、死信后的流程(以 RabbitMQ 为例)

复制代码
          ┌------------ 正常业务队列 ------------┐
          │                                       │
          │  x-dead-letter-exchange = "dlx.exchange" │
          │  x-dead-letter-routing-key = "dlq.key"  │
          ▼                                       │
   消费失败/过期/超限 → 消息被 reject/nack → RabbitMQ 自动转发 → 死信队列(DLQ)
                                                             │
                                                             ▼
                                                    死信消费者(日志、告警、人工补单)

三、代码片段(RabbitMQ)

java 复制代码
// 1. 声明正常队列时绑定死信参数
Map<String, Object> args = new HashMap<>();
args.put("x-dead-letter-exchange", "dlx.exchange");
args.put("x-dead-letter-routing-key", "dlq.key");
args.put("x-message-ttl", 30000);          // 30 秒没消费就过期进 DLQ
channel.queueDeclare("business.queue", true, false, false, args);

// 2. 声明死信交换机和队列
channel.exchangeDeclare("dlx.exchange", "direct");
channel.queueDeclare("dead.queue", true, false, false, null);
channel.queueBind("dead.queue", "dlx.exchange", "dlq.key");

四、Kafka 里的 DLQ

Kafka 没有原生 DLQ,客户端自己实现
spring-kafkaSeekToCurrentErrorHandler

重试 N 次后把消息发到名为 xxx.DLT(Dead-Letter Topic)的 topic,效果一样。


五、死信队列用来干啥

  • 记录+报警:消息进 DLQ 立刻发钉钉/邮件。
  • 人工修复:运营后台拉取 DLQ 内容,补发或修正数据。
  • 二次重试:DLQ 消费者等系统空闲再把消息写回原队列。

一句话:
死信队列 = 正常队列的" ICU 病房" ,专门收容那些救不活 的消息,让它们死得明白、死得有价值,而不是无声无息地消失。

相关推荐
難釋懷2 小时前
分布式锁的原子性问题
分布式
ai_xiaogui3 小时前
【开源前瞻】从“咸鱼”到“超级个体”:谈谈 Panelai 分布式子服务器管理系统的设计架构与 UI 演进
服务器·分布式·架构·分布式架构·panelai·开源面板·ai工具开发
凯子坚持 c4 小时前
如何基于 CANN 原生能力,构建一个支持 QoS 感知的 LLM 推理调度器
分布式
飞升不如收破烂~4 小时前
Redis 分布式锁+接口幂等性使用+当下流行的限流方案「落地实操」+用户连续点击两下按钮的解决方案自用总结
数据库·redis·分布式
无心水4 小时前
分布式定时任务与SELECT FOR UPDATE:从致命陷阱到优雅解决方案(实战案例+架构演进)
服务器·人工智能·分布式·后端·spring·架构·wpf
Lansonli4 小时前
大数据Spark(八十):Action行动算子fold和aggregate使用案例
大数据·分布式·spark
闻哥5 小时前
Kafka高吞吐量核心揭秘:四大技术架构深度解析
java·jvm·面试·kafka·rabbitmq·springboot
invicinble6 小时前
对于分布式的原子能力
分布式
心态还需努力呀15 小时前
CANN仓库通信库:分布式训练的梯度压缩技术
分布式·cann