reset Offset 与connection reset by peer

问题1 reset Offset

某次生产线上,从KafkaManager监控页面,发现还剩几十万未消费数据量,过了几分钟之后,监控页面发现未消费数据量达到了几千万。

排查分析

定位生产日志,发现消费端 出现日志 reset offset, 结合上下文日志,发现在切换broker leader之后,提交的偏移量在新leader上面找不到,之后根据消费端配置的auto offset reset 由于我们配置的是earliest,所以从最早消费

问题原因

切换时候,broker是接入某云的kafka,当时后台发生OOM,造成broker切换,由于ack设置,导致新切换的broker 没有提交的偏移量,从而导致整个现象发生


问题2 connection reset by peer

某次请求某服务,偶然频繁出现请求错误,但刷新错误之后,又可以重新打开请求链接

排查分析

根据traceId,定位到服务链调用,网关服务出现connection reset by peer,说明调用我们的业务微服务出现问题, 日志上下文 观察调用IP有多个,可实际情况后台docker 的pod数量为1

问题原因

由于eureka段配置不合理,导致未将失效的服务实例杀死,通过eureka注册中心可以管道有一个未清除的实例,从而导致该现象产生。
解决措施:先手动下线微服务实例,后修改配置

相关推荐
Rsun0455112 小时前
为什么要配置maven
java·maven
人道领域12 小时前
【Redis实战篇】初步基于Redis实现的分布式锁---基于黑马点评
java·数据库·redis·分布式·缓存
呱牛do it17 小时前
企业级门户网站设计与实现:基于SpringBoot + Vue3的全栈解决方案(Day 3)
java·vue
神の愛18 小时前
左连接查询数据 left join
java·服务器·前端
南境十里·墨染春水18 小时前
linux学习进展 线程同步——互斥锁
java·linux·学习
雨奔19 小时前
Kubernetes 联邦 Deployment 指南:跨集群统一管理 Pod
java·容器·kubernetes
杨凯凡19 小时前
【021】反射与注解:Spring 里背后的影子
java·后端·spring
lulu121654407819 小时前
Claude Code项目大了响应慢怎么办?Subagents、Agent Teams、Git Worktree、工作流编排四种方案深度解析
java·人工智能·python·ai编程
riNt PTIP19 小时前
SpringBoot创建动态定时任务的几种方式
java·spring boot·spring
老星*20 小时前
AI选股核心设计思路
java·ai·开源·软件开发