1.产生原因

消息积压（Message Backlog）指的是在消息队列（MQ）系统中等待被处理的消息数量超过了正常的处理速度，导致消息在队列中积压堆积的情况。

消息积压的常见表现：

消息积压的常见原因：

消息积压可能导致的后果：

2.解决办法

一说到消息积压，很多同学的第一反应可能是加机器，确实加机器是能处理掉消息积压的，因为不管是何种原因造成的消息积压，上机器一定是有效果的。但是很明显这不是最合理的解法，针对mq消息积压其实存在一套成熟的打法，一共分三步：

事前处理机制其实就是要对系统上线前进行一个预估，预估一下系统的mq要面对的峰值流量是多大，然后用单台机器部署压测，根据压测来确定机器的大概数量。一般事前压测后都能解决绝大多数问题。直接上我们的性能测试神器，jmeter：

文章链接：

如果在生产中系统中确实出现了mq的消息积压，必须存在事中机制来处理了。事中机制的核心目标是------恢复正常。

怎么恢复正常喃？其实就是扩容，然后快速消费完积压的消息，扩容十倍、二十倍、三十倍都可以，达成目的即可。当然这种情况下可以通过k8s来进行动态缩/扩容是最合适的。

发生生产环境的mq积压后，处理完mq的积压，需要加固一下系统，避免下一次的mq消息积压，一般事后的处理机制可以从如下几方面来预防下一次的mq消息积压：

提供消费并行度和优化消息的消费路径这个没啥好说的，事儿都发生了，要是能力不够该扩容就扩容，要是逻辑不对，该优化耗时就优化耗时。着重要讲一下的是跳过非重要消费。

跳过非重要消费：

在实际生产中，消息的类型也是有轻重缓急的，如果实在是发生了消息的堆积，这时候我们可以先不去消费不重要的消息，先去消费重要的消息。比如先不去消费日志消息，先处理订单消息。我们可以给mq上一个监控，设置一个阈值，当超过这个阈值的时候，触发跳过机制。

这时候我想有些同学会有点疑惑，怎么去监控mq中的消息数量喃？有以下几种方式：

JMX监控：如果你的MQ系统支持Java Management Extensions（JMX），你可以使用JMX客户端工具，如JConsole或VisualVM，连接到MQ服务器并监控队列的消息数量。这种方式能够实时获取消息数量。
API调用：许多MQ系统提供API，允许你通过编程方式查询队列的状态信息，包括消息数量。你可以编写脚本或应用程序，定期调用API来获取消息数量，并在需要时进行处理或记录。
监控工具：使用第三方监控工具或平台，如Prometheus、Grafana、Datadog等，将其与MQ系统集成。这些工具可以定期查询MQ的消息数量，并通过仪表板、图表或警报提供实时监控。
日志分析：在MQ系统的日志文件中可能会包含消息数量的信息。你可以使用日志分析工具来实时监控日志文件，并提取消息数量的指标。