pod调度--预选阶段（重点说容忍）

小白不想白a2026-01-31 9:09

我们已知，pod在创建时，调度器会根据预选和优选选择合适的节点调度pod运行。预选阶段过滤掉不满足条件的节点。预选策略通常考虑以下方面：

1、NodeSelector匹配

如果pod定义文件有的话，会检查node标签是否匹配

2、检查节点的CPU、内存等资源是否满足Pod请求。

3、端口是否有占用

4、检查节点是否满足pod的亲和性规则

5、检查节点是否有不被pod容忍的污点

前三条比较容易理解，本文探究pod中的亲和性规则和容忍规则如何书写。

一开始，我对pod的容忍机制不是很理解，为什么不是选择，而是容忍？后来豆包给我举了一个场景，这种容忍机制更灵活：假如我有一个pod不可用了，我只需要在pod上打一个污点，只要pod没有容忍这个污点那么pod就会被驱逐，而不需要修改每个pod。

所以容忍机制就像一对情侣，男方/女方（node）犯错（资源不可用、失联），另一半（pod）会开始计算分手（驱逐）时间，是一种原谅，即容忍行为，而不是对节点的选择行为。而选择伴侣（调度pod）的过程中就会看对方（node）有哪些缺点是不能容忍的，从而不会调度到该节点。

实例：

以下是kubectl get pod pod-name -o yaml的截取内容

复制代码

  tolerations:       #这个"容忍"是pod级别的，这组容忍配置是默认配置
  - effect: NoExecute           #污点效果：立即驱逐
    key: node.kubernetes.io/not-ready    #污点键
    operator: Exists                   #匹配方式，只要存在这个键就驱逐
    tolerationSeconds: 300       #容忍时间
#当节点状态是not ready时，时间超过300s pod会被立即驱逐
  - effect: NoExecute
    key: node.kubernetes.io/unreachable
    operator: Exists
    tolerationSeconds: 300
#同上，节点失联

这个默认规则的作用是防止节点短暂故障（如网络抖动）时pod被驱逐。

其他operator可能的值：

equal：key-value都匹配

exists：key为空时，容忍所有节点（不管你有什么缺点，我都原谅你）

DoesNotExist用的比较少

其他effect可能的值：

NoSchedule、PreferNoSchedule、NoExecute

粘几张ai提供的实例更好理解：