pod调度--预选阶段(重点说容忍)

我们已知,pod在创建时,调度器会根据预选和优选选择合适的节点调度pod运行。预选阶段过滤掉不满足条件的节点。预选策略通常考虑以下方面:

1、NodeSelector匹配

如果pod定义文件有的话,会检查node标签是否匹配

2、检查节点的CPU、内存等资源是否满足Pod请求。

3、端口是否有占用

4、检查节点是否满足pod的亲和性规则

5、检查节点是否有不被pod容忍的污点

前三条比较容易理解,本文探究pod中的亲和性规则和容忍规则如何书写。

一开始,我对pod的容忍机制不是很理解,为什么不是选择,而是容忍?后来豆包给我举了一个场景,这种容忍机制更灵活:假如我有一个pod不可用了,我只需要在pod上打一个污点,只要pod没有容忍这个污点那么pod就会被驱逐,而不需要修改每个pod。

所以容忍机制就像一对情侣,男方/女方(node)犯错(资源不可用、失联),另一半(pod)会开始计算分手(驱逐)时间,是一种原谅,即容忍行为,而不是对节点的选择行为。而选择伴侣(调度pod)的过程中就会看对方(node)有哪些缺点是不能容忍的,从而不会调度到该节点。

实例:

以下是kubectl get pod pod-name -o yaml的截取内容

复制代码
  tolerations:       #这个"容忍"是pod级别的,这组容忍配置是默认配置
  - effect: NoExecute           #污点效果:立即驱逐
    key: node.kubernetes.io/not-ready    #污点键
    operator: Exists                   #匹配方式,只要存在这个键就驱逐
    tolerationSeconds: 300       #容忍时间
#当节点状态是not ready时,时间超过300s pod会被立即驱逐
  - effect: NoExecute
    key: node.kubernetes.io/unreachable
    operator: Exists
    tolerationSeconds: 300
#同上,节点失联

这个默认规则的作用是防止节点短暂故障(如网络抖动)时pod被驱逐。

其他operator可能的值:

equal:key-value都匹配

exists:key为空时,容忍所有节点(不管你有什么缺点,我都原谅你)

DoesNotExist用的比较少

其他effect可能的值:

NoSchedule、PreferNoSchedule、NoExecute

粘几张ai提供的实例更好理解:

相关推荐
云计算磊哥@2 天前
运维开发宝典030-MySQL06数据库运维阶段总结
运维·数据库·运维开发
java_cj2 天前
从kubectl学Visitor模式:如何优雅处理多态数据结构的遍历
云原生·golang·k8s·访问者模式
黄狗操作员3 天前
NCCL 2.29 官方文档参数解读
语言模型·云计算·运维开发·gpu算力
盒子69103 天前
大模型运维中ECC Mode问题
ai·运维开发·ai编程
java_cj3 天前
从kubectl源码学Cobra:打造专业级Go命令行工具的完整实践
运维·开发语言·后端·云原生·golang·kubernetes·k8s
云计算磊哥@3 天前
运维开发宝典029-MySQL05Replication
运维·运维开发
Jerry.张蒙3 天前
AI工具Opencode助力SAP提质增效实践
大数据·运维·服务器·人工智能·运维开发
江南风月4 天前
WGCLOUD保姆级教程最新版整理
运维·zabbix·运维开发·prometheus·日志审计
CDN3604 天前
【工程化进阶】Lerna太慢?用 Turborepo + pnpm 打造拓扑级增量构建大仓
运维开发
江南风月4 天前
Hermes Agent 接入WGCLOUD实战:打造团队 AI 智能运维解决方案
运维·zabbix·运维开发·prometheus