k8s调度机制:亲和性,污点,容忍

Kubernetes 调度机制:亲和性、污点与容忍全解析

在 Kubernetes 的调度机制中,有三个重要概念:节点亲和性污点 和 **容忍 **。它们是 Kubernetes 调度的核心,决定了 Pod 是如何被调度到具体节点的。理解这三者之间的关系,可以帮助我们更精确地控制集群中的 Pod 调度。

1. 节点亲和性

什么是节点亲和性?

简单来说,节点亲和性就是让 Pod 主动选择节点 的机制。通过设置亲和性规则,你可以让 Pod 更倾向于调度到某些符合条件的节点。

适用场景:

  • 需要特定硬件支持的任务,比如数据库 Pod 只想运行在带 SSD 存储的节点上。
  • 性能要求高的业务,比如某些关键业务 Pod 只想跑在高性能节点上。

示例:

假设你想把某个业务 Pod 只调度到类型为 "high-performance" 的节点上,可以这么做:

复制代码
nodeAffinity:
  requiredDuringSchedulingIgnoredDuringExecution:
    nodeSelectorTerms:
    - matchExpressions:
      - key: "node-type"
        operator: In
        values:
        - high-performance

2. 污点 (Taint)

什么是污点?

污点是节点主动设置的条件,表示 节点不愿意接受 Pod。你可以给节点加上污点,防止其他 Pod 被调度到这个节点上。

适用场景:

  • GPU 节点通常只给 AI 训练任务使用,其他普通 Pod 需要被拒绝调度到这些节点。
  • 节点出现故障时,可以通过污点避免新 Pod 调度到这个节点。

示例:

在 GPU 节点上设置污点,防止普通 Pod 调度到该节点:

复制代码
kubectl taint nodes gpu-node type=gpu:NoSchedule

3. 容忍 (Toleration)

什么是容忍?

容忍就是 Pod 声明"我能忍受污点" 的机制。被污点标记的节点,不是所有的 Pod 都会被拒绝,只有那些声明了"容忍"这个污点的 Pod,才能顺利调度到这些节点上。

适用场景:

  • 如果某个 Pod 想调度到 GPU 节点,必须声明容忍 GPU 的污点。
  • 即便是有故障的节点,只要某个 Pod 有容忍该节点的污点,它仍然可以在该节点运行。

示例:

如果 Pod 要调度到被污点标记的 GPU 节点,它需要添加以下容忍设置:

复制代码
tolerations:
  - key: "type"
    operator: "Equal"
    value: "gpu"
    effect: "NoSchedule"

Kubernetes 调度机制总结

机制 定义主体 控制方向 结果
节点亲和性 (Node Affinity) Pod 主动选择节点 优先调度到符合条件的节点
污点 (Taint) 节点 主动拒绝 Pod 被污点标记的节点不接受 Pod
容忍 (Toleration) Pod 主动声明"我能忍" 只有带有容忍设置的 Pod 才能绕过污点

总结

Kubernetes 的调度机制可以用 "亲和性 + 污点 + 容忍" 三个词来概括:

  • 亲和性:Pod 主动选择节点
  • 污点:节点主动拒绝 Pod
  • 容忍:Pod 声明"我能忍受这个污点"

这三者结合起来,就能灵活地控制 Pod 的调度方式,解决了 Kubernetes 中 Pod 调度的"正向匹配 + 反向隔离"问题。

相关推荐
薪火铺子8 小时前
微服务认证方案对比与选型
微服务·云原生·架构
运维全栈笔记9 小时前
K8S部署Redis高可用全攻略:1主2从3哨兵架构实战
redis·docker·云原生·容器·架构·kubernetes·bootstrap
尘世壹俗人10 小时前
使用K8s部署模型
kubernetes
AI攻城狮11 小时前
AI Agent 从上线到删库跑路始末
云原生
AI木马人12 小时前
9.人工智能实战:GPU 服务如何上 Kubernetes?从单机部署到 K8s + NVIDIA Device Plugin + HPA 的生产级改造
人工智能·容器·kubernetes
码点滴16 小时前
告别显存焦虑:PagedAttention 如何将大模型吞吐量提升 4 倍?
人工智能·架构·kubernetes·大模型·pagedattention
键盘鼓手苏苏17 小时前
Kubernetes 容器安全最佳实践
云原生·kubernetes·k8
Elastic 中国社区官方博客17 小时前
Elasticsearch Serverless 中跨项目搜索(CPS)的工作原理
大数据·elasticsearch·搜索引擎·云原生·serverless
键盘鼓手苏苏17 小时前
Kubernetes 安全最佳实践
云原生·kubernetes·k8
小妖同学学AI19 小时前
云原生AI服务新范式:Jina Serve框架,让多模态大模型落地像搭积木一样简单
人工智能·云原生·jina