reset Offset 与connection reset by peer

问题1 reset Offset

某次生产线上,从KafkaManager监控页面,发现还剩几十万未消费数据量,过了几分钟之后,监控页面发现未消费数据量达到了几千万。

排查分析

定位生产日志,发现消费端 出现日志 reset offset, 结合上下文日志,发现在切换broker leader之后,提交的偏移量在新leader上面找不到,之后根据消费端配置的auto offset reset 由于我们配置的是earliest,所以从最早消费

问题原因

切换时候,broker是接入某云的kafka,当时后台发生OOM,造成broker切换,由于ack设置,导致新切换的broker 没有提交的偏移量,从而导致整个现象发生


问题2 connection reset by peer

某次请求某服务,偶然频繁出现请求错误,但刷新错误之后,又可以重新打开请求链接

排查分析

根据traceId,定位到服务链调用,网关服务出现connection reset by peer,说明调用我们的业务微服务出现问题, 日志上下文 观察调用IP有多个,可实际情况后台docker 的pod数量为1

问题原因

由于eureka段配置不合理,导致未将失效的服务实例杀死,通过eureka注册中心可以管道有一个未清除的实例,从而导致该现象产生。
解决措施:先手动下线微服务实例,后修改配置

相关推荐
泡^泡8 分钟前
Spring AI简单高仿DeepSeek问答页面
java·人工智能·spring
带刺的坐椅20 分钟前
Solon v4.0 正式发布,高考记忆版
java·ai·solon·flow·solon-ai
JAVA面经实录9172 小时前
操作系统(面试全覆盖)
java·计算机网络·面试
编程的一拳超人2 小时前
Maven 国内高速镜像推荐(按速度排序)
java·maven
云烟成雨TD3 小时前
Spring AI 1.x 系列【61】Spring AI 2.0 升级指南
java·人工智能·spring
lulu12165440784 小时前
OpenRouter Fusion 多模型融合架构深度拆解:预算级模型组团打平 Fable 5,多模型协作才是 AGI 的正确打开方式?
java·人工智能·架构·ai编程·agi
雨辰AI4 小时前
生产级实测:SpringBoot3 + 达梦数据库接口从 200ms 优化至 20ms 完整调优指南
java·数据库·spring boot·后端·政务
(Charon)4 小时前
【C++ 面试高频:内存管理、RAII 和智能指针详解】
java·开发语言·word
凡人叶枫4 小时前
Effective C++ 条款39:明智而审慎地使用 private 继承
java·数据库·c++·嵌入式开发