K8s问题案例分析

1.worker节点宕机,请说明一下pod的驱逐流程:

k8s有一个节点控制器,节点控制器在一段时间内无法和kubelet通信,那么就会给节点打上unknown 状态,并自动创建NoExecute污点,避免调度器调度新的pod到该节点。同时已经在这个节点运行的pod,在经过五分钟的容忍时间后被NoExecute自动驱逐。

2.尝试用的日志分析工具在K8s种如何与集群进行通信:

方案一:

一个pod节点部署一个应用容器和边车容器,用共享存储卷emptydir共享两个容器之中的日志目录,边车容器部署这日志收集工具比如:filebeat/fluentd(菲尔安提的)收集共享存储的日志,采集完发送个ESpod集群的service的clusterip,再通过service转发给ES,kibana通过ES的service的cluster访问到es相关的数据进行可视化管理操作。

方案二:

运用hostpath的方法把容器里的日志目录挂载在pod在宿主机的的的目录上,在宿主机上部署filebeat/fluentd 收集日志发送给ESpod集群的service的nodeport(因为时外部宿主机访问),service再转发给ESpod集群,pod容器里的kibana通过ESpod集群的clusterip访问到ES相关的数据进行可视化管理操作。

3. pod启动失败如何解决以及常见的原因有哪些:

没有合适的node节点部署pod,镜像拉取失败,存储券挂载失败,健康检查失败(探针),容器启动失败,启动命令有问题。

4.K8S雪崩:

5.在docker容器里面进行抓包:

kubectl describe pod pod名称 -n 命名空间 -o wide | grep -i 'id'

#获取pod所在的容器id 也就是container id

docker inspect containerid |grep -i pid #根据找到的pid进入pod的网络命名空间

nsenter -t pid号 -n #使用tcpdump进行抓包 #根据找到的pid进入pod的网络命名空间

tcpdump -w xxx.pcap #使用tcpdump进行抓包

相关推荐
江湖有缘1 小时前
Docker部署开源LinkAI大模型安全接入网关服务平台
安全·docker·开源
木雷坞1 小时前
LiteLLM Docker 部署:config.yaml、Master Key 和 Postgres 配置
运维·docker·容器·litellm
川石课堂软件测试2 小时前
UI自动化测试|元素操作&浏览器操作实践
功能测试·测试工具·mysql·ui·docker·容器·单元测试
丑过三八线2 小时前
Docker Podman 启动命令
docker·容器·podman
r-t-H2 小时前
Docker进阶与容器编排实践-第三章
运维·docker·容器
willhuo2 小时前
Docker 存储目录迁移:解决 No space left on device
docker·容器·eureka
Dontla2 小时前
WSL卡死解决办法(wsl2卡死、WSL死机、WSL无响应、WSL无法启动、Docker Desktop卡死)(重启后解决了)
docker
极客先躯3 小时前
高级java每日一道面试题-2026年02月07日-实战篇[Docker]-如何使用存储插件(如 NFS、Ceph)?
运维·分布式·容器·自动化·文件·插件·高可用
“码”力全开3 小时前
打通安防孤岛:基于 Docker 与 GB28181/RTSP 架构的 AI 视频管理平台,全源码交付解锁二次开发自主权
人工智能·docker·架构
杨了个杨89823 小时前
阿里云 ACR Docker 镜像分发
阿里云·docker·云计算