K8S容器挂了后重启状态正常,但应用无法访问排查处理

K8S容器挂了后重启状态正常,但应用无法访问排查处理

背景:

应用迁移K8S后因POD OOM挂了后重启,集群上POD状态正常,但应用无法访问。

排查:

查看应用日志,是启动时调用特权账号管理系统超时,导致连接数据库失败。但tomcat正常启动,配置的http健康检查页面是放在tomcat里的,而非应用的页面。所以K8S健康检查成功,但实际应用未启动成功。

解决:

临时方案:手动重启,再调用特权账号管理系统时连接未超时,应用成功启动。

后续方案:开发在应用代码包里配置健康检查页面,运维将健康检查路径配置成代码包里的。

相关推荐
阿里云云原生7 小时前
AgentTeams 和 Claude Tag 都进入群聊模式,是新范式还是新叙事?
云原生·agent
阿里云云原生1 天前
Higress v2.2.3 发布:正式入驻 CNCF Sandbox,AI Gateway 与 Ingress 迁移能力双向加固
云原生
lichenyang4532 天前
Docker 学习笔记(四):Dockerfile,把项目打成自己的镜像
docker·容器
lichenyang4532 天前
Docker 学习笔记(三):Docker 网络、bridge、子网和容器互通
docker·容器
lichenyang4532 天前
Docker 学习笔记(二):docker run 的参数到底在控制什么?
docker·容器
阿里云云原生2 天前
香港站【企业 AI Agent 工程化实战专场】来啦,邀您7月9日见!
云原生·agent
阿里云云原生2 天前
研发域与运维域的“数字握手”:通过 Agentic Skills 实现 DevOps 全链路自动化
云原生
运维开发故事4 天前
基于 Arthas 的多集群在线诊断系统设计与实现
kubernetes
Patrick_Wilson6 天前
从「改个端口」到 502:Next.js on k8s 的容器端口、Service 映射与 env 覆盖
docker·kubernetes·next.js
阿里云云原生6 天前
AI 开发新常态:当 Cursor、Claude、Codex 并行,如何统一管理散落的 Skill 资产?
云原生·ai编程