pod调度--预选阶段(重点说容忍)

我们已知,pod在创建时,调度器会根据预选和优选选择合适的节点调度pod运行。预选阶段过滤掉不满足条件的节点。预选策略通常考虑以下方面:

1、NodeSelector匹配

如果pod定义文件有的话,会检查node标签是否匹配

2、检查节点的CPU、内存等资源是否满足Pod请求。

3、端口是否有占用

4、检查节点是否满足pod的亲和性规则

5、检查节点是否有不被pod容忍的污点

前三条比较容易理解,本文探究pod中的亲和性规则和容忍规则如何书写。

一开始,我对pod的容忍机制不是很理解,为什么不是选择,而是容忍?后来豆包给我举了一个场景,这种容忍机制更灵活:假如我有一个pod不可用了,我只需要在pod上打一个污点,只要pod没有容忍这个污点那么pod就会被驱逐,而不需要修改每个pod。

所以容忍机制就像一对情侣,男方/女方(node)犯错(资源不可用、失联),另一半(pod)会开始计算分手(驱逐)时间,是一种原谅,即容忍行为,而不是对节点的选择行为。而选择伴侣(调度pod)的过程中就会看对方(node)有哪些缺点是不能容忍的,从而不会调度到该节点。

实例:

以下是kubectl get pod pod-name -o yaml的截取内容

复制代码
  tolerations:       #这个"容忍"是pod级别的,这组容忍配置是默认配置
  - effect: NoExecute           #污点效果:立即驱逐
    key: node.kubernetes.io/not-ready    #污点键
    operator: Exists                   #匹配方式,只要存在这个键就驱逐
    tolerationSeconds: 300       #容忍时间
#当节点状态是not ready时,时间超过300s pod会被立即驱逐
  - effect: NoExecute
    key: node.kubernetes.io/unreachable
    operator: Exists
    tolerationSeconds: 300
#同上,节点失联

这个默认规则的作用是防止节点短暂故障(如网络抖动)时pod被驱逐。

其他operator可能的值:

equal:key-value都匹配

exists:key为空时,容忍所有节点(不管你有什么缺点,我都原谅你)

DoesNotExist用的比较少

其他effect可能的值:

NoSchedule、PreferNoSchedule、NoExecute

粘几张ai提供的实例更好理解:

相关推荐
WAIT_TIME3 天前
RKE2 + KubeSphere 部署方案
k8s·kubesphere·rancher·rke2
慧天城寻3 天前
H3C巡检命令与避坑技巧
运维·网络·运维开发
稀样4 天前
常见的学习资料网站
k8s·jenkins
上海蓝色星球4 天前
造价机器人CER V2.0正式上线!
大数据·人工智能·智慧城市·运维开发
ZKNOW甄知科技4 天前
深度对标ServiceNow:燕千云如何破解企业全球化运维难题?
大数据·运维·人工智能·科技·ai·自动化·运维开发
学不完的5 天前
redis
数据库·redis·缓存·运维开发
老友@5 天前
云计算的统一心智模型
开发语言·ci/cd·docker·云计算·k8s·perl
Night_Elf5 天前
OpenClaw:完全零成本在Windows本机部署OpenClaw免费大模型指南
经验分享·自动化·运维开发·程序员创富
王九思19 天前
Thrift Server 介绍
大数据·系统架构·运维开发
青靴19 天前
【运维开发实战】从0到1搭建半导体初创公司内网智能知识库与运维助手
运维·运维开发