reset Offset 与connection reset by peer

问题1 reset Offset

某次生产线上,从KafkaManager监控页面,发现还剩几十万未消费数据量,过了几分钟之后,监控页面发现未消费数据量达到了几千万。

排查分析

定位生产日志,发现消费端 出现日志 reset offset, 结合上下文日志,发现在切换broker leader之后,提交的偏移量在新leader上面找不到,之后根据消费端配置的auto offset reset 由于我们配置的是earliest,所以从最早消费

问题原因

切换时候,broker是接入某云的kafka,当时后台发生OOM,造成broker切换,由于ack设置,导致新切换的broker 没有提交的偏移量,从而导致整个现象发生


问题2 connection reset by peer

某次请求某服务,偶然频繁出现请求错误,但刷新错误之后,又可以重新打开请求链接

排查分析

根据traceId,定位到服务链调用,网关服务出现connection reset by peer,说明调用我们的业务微服务出现问题, 日志上下文 观察调用IP有多个,可实际情况后台docker 的pod数量为1

问题原因

由于eureka段配置不合理,导致未将失效的服务实例杀死,通过eureka注册中心可以管道有一个未清除的实例,从而导致该现象产生。
解决措施:先手动下线微服务实例,后修改配置

相关推荐
geovindu几秒前
python: Adapter Pattern
java·python·设计模式·适配器模式
蜜獾云1 分钟前
设计模式之工厂方法模式(5):稍微复杂一点的工厂模式
java·设计模式·工厂方法模式
Voyager_44 分钟前
吃透设计模式:从原理到落地(如何选型),Java/Spring开发场景
java·spring·设计模式
技术人生黄勇4 分钟前
微信接入|企业微信官方插件支持 OpenClaw 3步快速接入(实操版)
java·前端·人工智能·微信·企业微信
崔小汤4 分钟前
SpringAI实战之结构化输出
java·ai
Lin_林10 分钟前
国内 Docker 服务状态 & 镜像加速监控
java·开发语言
予枫的编程笔记12 分钟前
【面试专栏|JVM虚拟机】从Serial到ZGC,JVM垃圾收集器进化史
java·jvm·垃圾收集器·zgc·g1 gc·serial gc·cms gc
逝水如流年轻往返染尘15 分钟前
java中类和对象
java
*.✧屠苏隐遥(ノ◕ヮ◕)ノ*.✧18 分钟前
Java 集合 (Collection)
java·开发语言
后端AI实验室18 分钟前
我让AI review了自己写的代码,然后删掉了30%
java·ai