Kubernetes Node 节点的生命周期简述

Node 节点是 Kubernetes 的核心组件之一,其生命周期可以简要概括为:注册、运行、下线。本文将简要介绍 Node 生命周期中发生的关键事件。

节点注册

每个 node 节点都需要运行 kubeletkubelet 启动后会向 kube-apiserver 发起节点的注册请求,即创建一个新的 node 资源对象。

Kubelet 配置文件中的 registerNode(或命令行参数 --register-node)的值默认为 true,用来控制是否自动注册节点。如果你希望手动管理节点的注册行为,可以将此项设置为 false。

节点的名称 nodename 由以下因素决定:

  • 如果配置了 cloud provider,则由云供应商提供名称。
  • 否则使用本机的 hostname,而 hostname 也可以通过 kubelet 的配置项 --hostname-override 覆盖掉。

注册节点实质上是创建了一个新的 node 资源对象,此时 kubelet 便会收集有关节点的状态信息一并提交。该接口也可以重复提交,反复注册并不会有什么影响。

节点心跳机制

节点的心跳机制包括两部分:节点 .status 状态信息更新,以及节点对应的 lease 对象更新。

Kubelet 配置文件中的 nodeStatusUpdateFrequency(或命令行参数 --node-status-update-frequency)默认为 10 秒钟。这意味着当节点状态发生改变时,或者达到了 10 秒钟,kubelet 会向 kube-apiserver 发起请求,以更新节点的 .status 状态信息。

每个节点都会在 kube-node-lease 这个命名空间中维护一个同名的 lease 对象,更新频率为 kubelet 配置文件中的 nodeLeaseDurationSeconds(默认 40 秒)* 0.25,即 10 秒钟。

节点健康监控

controller-manager 中的 node-controller(准确说是 node-lifecycle-controller)负责监控节点的健康情况。如果一切正常,那自然万事大吉。

但是如果节点出现网络中断或者宕机等情况时,node-controller 便会发现节点的心跳信息长时间未更新,一旦超过 controller-manager 的配置项 --node-monitor-grace-period 设置的时长(默认 40 秒,在未来的 v1.32 版将会变更为 50 秒),node-controller 会将该节点的状态设置为 Unknown,并给节点打上 Taint 污点,避免新的 pod 被调度。随后再等待 5 分钟,如果节点仍未恢复心跳,则开始向 kube-apiserver 发起请求,驱逐节点上的 pod 等资源。

节点的正常下线也非常类似,标记污点、重新调度 pod、下线节点。

(我是凌虚,关注我,无广告,专注技术,不煽动情绪,欢迎与我交流)


参考资料:

相关推荐
码事漫谈43 分钟前
C++死锁深度解析:从成因到预防与避免
后端
码事漫谈1 小时前
智能体颠覆教育行业:现状、应用与未来展望调研报告
后端
蓝-萧1 小时前
【玩转全栈】----Django基本配置和介绍
java·后端
priority_key1 小时前
排序算法:堆排序、快速排序、归并排序
java·后端·算法·排序算法·归并排序·堆排序·快速排序
韩立学长1 小时前
基于Springboot的旧时月历史论坛4099k6s9(程序、源码、数据库、调试部署方案及开发环境)系统界面展示及获取方式置于文档末尾,可供参考。
数据库·spring boot·后端
汤姆yu2 小时前
基于SpringBoot的动漫周边商场系统的设计与开发
java·spring boot·后端
灰小猿2 小时前
Spring前后端分离项目时间格式转换问题全局配置解决
java·前端·后端·spring·spring cloud
熊文豪3 小时前
openEuler 云原生实战:部署高性能 Redis 集群与压测分析
数据库·redis·云原生·openeuler
RedJACK~4 小时前
Go Ebiten小游戏开发:扫雷
开发语言·后端·golang
阿里云云原生4 小时前
阿里云微服务引擎 MSE 及 API 网关 2025 年 10 月产品动态
阿里云·微服务·云原生·云计算