K8S 亲和性与反亲和性

介绍

在 Kubernetes 中,亲和性(Affinity)是一种用于控制 Pod 调度的机制,它允许你指定 Pod 如何与节点进行互动,以便将 Pod 调度到合适的节点上。亲和性可以分为两种类型:节点亲和性(Node Affinity)和 Pod 亲和性(Pod Affinity)。

节点亲和性(Node Affinity)

开始之前需要先给节点打标签,不知道怎样打标签可以看这篇文章

bash 复制代码
## 先查看所有节点的标签
kubectl get nodes --show-labels

## 给其中一个节点打标签
kubectl label nodes node01 disktype=ssd

节点亲和性有两种

硬亲和性 requiredDuringSchedulingIgnoredDuringExecution

指定了 Pod 必须调度到具有指定特征的节点上,如果没有满足条件的节点则 Pod 不会被调度。

举例:

yaml 复制代码
apiVersion: v1
kind: Pod
metadata:
  name: nginx
spec:
  affinity:
    nodeAffinity:
      requiredDuringSchedulingIgnoredDuringExecution: # 硬亲和性
        nodeSelectorTerms:
        - matchExpressions:
          - key: disktype
            operator: In
            values:
            - ssd            
  containers:
  - name: nginx
    image: nginx
    imagePullPolicy: IfNotPresent

这个Pod正常会部署到node01上面。

字段解释:

  • affinity: 这是 Pod 配置中的一个字段,用于定义亲和性规则。
  • nodeAffinity: 指定了节点亲和性规则。
  • requiredDuringSchedulingIgnoredDuringExecution: 这是一个硬亲和性规则,表示 Pod 必须被调度到满足条件的节点上,否则将无法调度。
  • nodeSelectorTerms: 用于指定匹配条件的节点选择器条款。
  • matchExpressions: 定义了节点选择器的匹配表达式。
  • key: disktype: 指定了匹配条件的键,这里是磁盘类型(disktype)。
  • operator: In: 指定了匹配操作符,这里是 "In",表示匹配键的值在指定的值列表中。
  • values: - ssd: 指定了匹配条件的值列表,这里只有一个值 "ssd",表示磁盘类型为 SSD 的节点符合条件。

operator 参数解释:

下面是你可以在上述 nodeAffinity 和 podAffinity 的 operator 字段中可以使用的所有逻辑运算符。

  • In 标签值存在于提供的字符串集中
  • NotIn 标签值不包含在提供的字符串集中
  • Exists 对象上存在具有此键的标签
  • DoesNotExist 对象上不存在具有此键的标签

以下操作符只能与 nodeAffinity 一起使用:

  • Gt 提供的值将被解析为整数,并且该整数小于通过解析此选择算符命名的标签的值所得到的整数
  • Lt 提供的值将被解析为整数,并且该整数大于通过解析此选择算符命名的标签的值所得到的整数

软亲和性 preferredDuringSchedulingIgnoredDuringExecution

指定了 Pod 倾向于调度到具有指定特征的节点上,但如果没有满足条件的节点也可以被调度。

举例:

yaml 复制代码
apiVersion: v1
kind: Pod
metadata:
  name: nginx
spec:
  affinity:
    nodeAffinity:
      preferredDuringSchedulingIgnoredDuringExecution: # 软亲和性
      - weight: 1
        preference:
          matchExpressions:
          - key: disktype
            operator: In
            values:
            - ssd          
  containers:
  - name: nginx
    image: nginx
    imagePullPolicy: IfNotPresent

字段解释:

  • weight: 1 表示这个节点亲和性规则的权重为 1。这意味着这个规则相对于其他规则来说是具有相对较低的优先级的。

说明

  • 如果你同时指定了 nodeSelector 和 nodeAffinity,两者必须都要满足, 才能将 Pod 调度到候选节点上。(这个不在举例比较容易理解)

  • 如果你在与 nodeAffinity 类型关联的 nodeSelectorTerms 中指定多个条件, 只要其中一个 nodeSelectorTerms 满足(各个条件按逻辑或操作组合)的话,Pod 就可以被调度到节点上。

  • 如果你在与 nodeSelectorTerms 中的条件相关联的单个 matchExpressions 字段中指定多个表达式, 则只有当所有表达式都满足(各表达式按逻辑与操作组合)时,Pod 才能被调度到节点上。

节点亲和性权重

可以为 preferredDuringSchedulingIgnoredDuringExecution 亲和性类型的每个实例设置 weight 字段,其取值范围是 1 到 100。

举例:

yaml 复制代码
apiVersion: v1
kind: Pod
metadata:
  name: with-nginx
spec:
  affinity:
    nodeAffinity:
      requiredDuringSchedulingIgnoredDuringExecution:
        nodeSelectorTerms:
        - matchExpressions:
          - key: kubernetes.io/os
            operator: In
            values:
            - linux
      preferredDuringSchedulingIgnoredDuringExecution:
      - weight: 1
        preference:
          matchExpressions:
          - key: label-1
            operator: In
            values:
            - key-1
      - weight: 50
        preference:
          matchExpressions:
          - key: label-2
            operator: In
            values:
            - key-2
  containers:
  - name: with-node-nginx
    image: nginx

部署成功以后根据亲和度会调度到 节点标签为 kubernetes.io/os=linux,label-2=key-2 的节点上面。

Pod 亲和性(Pod Affinity)

Pod 亲和性定义了 Pod 如何与其他 Pod 进行互动,以便将 Pod 调度到与其他 Pod 相关联的节点上。你可以使用 Pod 亲和性来指定 Pod 与其他 Pod 的关系,如必须调度到与特定 Pod 相同的节点上或避免调度到与特定 Pod 相同的节点上。

Pod 的亲和性与反亲和性也有两种类型:

  • requiredDuringSchedulingIgnoredDuringExecution
  • preferredDuringSchedulingIgnoredDuringExecution

使用 requiredDuringSchedulingIgnoredDuringExecution 亲和性来告诉调度器, 将两个服务的 Pod 必须放到同一个节点上。或者使用 preferredDuringSchedulingIgnoredDuringExecution 尽量将两个服务的Pod 部署到同一个节点上。或者配置反亲和性不部署在同一个节点上面。

Pod 亲和性

举例:

yaml 复制代码
apiVersion: v1
kind: Pod
metadata:
  name: with-pod-nginx
spec:
  affinity:
    podAffinity:
      requiredDuringSchedulingIgnoredDuringExecution:  # 硬亲和性
      - labelSelector:
          matchExpressions:
          - key: security
            operator: In
            values:
            - S1
        topologyKey: topology.kubernetes.io/zone
  containers:
  - name: with-nginx
    image: nginx

只有节点属于特定的区域 且该区域中的其他 Pod 已打上 security=S1 标签时,调度器才可以将示例 Pod 调度到此节点上,否则将不会被调度。软亲和性不在演示和上面这个类似。

还可以添加 namespaceSelector 限制条件:

yaml 复制代码
apiVersion: v1
kind: Pod
metadata:
  name: with-pod-nginx
spec:
  affinity:
    podAffinity:
      requiredDuringSchedulingIgnoredDuringExecution:  # 硬亲和性
      - labelSelector:
          matchExpressions:
          - key: security
            operator: In
            values:
            - S1
        topologyKey: topology.kubernetes.io/zone # 这个是K8S节点的标签。表示必须在节点标签是"topology.kubernetes.io/zone" 的基础上满足上面节点亲和力的条件
    namespaceSelector: 
      matchExpressions:
      - key: environment
        operator: In
        values:
        - production
  containers:
  - name: with-nginx
    image: nginx

这个 namespaceSelector 规定了只有具有标签 environment=production 的命名空间中的 Pod 才会受到这个亲和性规则的影响。这样可以将规则限制在特定环境下的命名空间中,避免对整个集群产生影响。

注意:空的 namespaceSelector({})会匹配所有名字空间,而 null 或者空的 namespaces 列表以及 null 值 namespaceSelector 意味着"当前 Pod 的名字空间"。

Pod 反亲和性

举例:

yaml 复制代码
apiVersion: v1
kind: Pod
metadata:
  name: with-pod-affinity
spec:
  affinity:
    podAntiAffinity:
      preferredDuringSchedulingIgnoredDuringExecution:
      - weight: 100
        podAffinityTerm:
          labelSelector:
            matchExpressions:
            - key: security
              operator: In
              values:
              - S2
          topologyKey: topology.kubernetes.io/zone
  containers:
  - name: with-pod-affinity
    image: registry.k8s.io/pause:2.0

Pod 反亲和性规则要求将具有相同标签 security=S2 的 Pod 尽量调度到不同的节点上,以提高系统的容错性和可用性。

nodeName

nodeName 是比亲和性或者 nodeSelector 更为直接的形式。nodeName 是 Pod 规约中的一个字段。如果 nodeName 字段不为空,调度器会忽略该 Pod, 而指定节点上的 kubelet 会尝试将 Pod 放到该节点上。 使用 nodeName 规则的优先级会高于使用 nodeSelector 或亲和性与非亲和性的规则。

使用 nodeName 来选择节点的方式有一些局限性:

  • 如果所指代的节点不存在,则 Pod 无法运行,而且在某些情况下可能会被自动删除。
  • 如果所指代的节点无法提供用来运行 Pod 所需的资源,Pod 会失败, - 而其失败原因中会给出是否因为内存或 CPU 不足而造成无法运行。
  • 在云环境中的节点名称并不总是可预测的,也不总是稳定的。

举例:

yaml 复制代码
apiVersion: v1
kind: Pod
metadata:
  name: nginx
spec:
  containers:
  - name: nginx
    image: nginx
  nodeName: kube-01

这个Pod 部署成功以后会运行到 kube-01 节点上。

相关推荐
chuanauc7 小时前
Kubernets K8s 学习
java·学习·kubernetes
小张是铁粉7 小时前
docker学习二天之镜像操作与容器操作
学习·docker·容器
烟雨书信7 小时前
Docker文件操作、数据卷、挂载
运维·docker·容器
IT成长日记8 小时前
【Docker基础】Docker数据卷管理:docker volume prune及其参数详解
运维·docker·容器·volume·prune
这儿有一堆花8 小时前
Docker编译环境搭建与开发实战指南
运维·docker·容器
LuckyLay8 小时前
Compose 高级用法详解——AI教你学Docker
运维·docker·容器
Uluoyu8 小时前
redisSearch docker安装
运维·redis·docker·容器
IT成长日记12 小时前
【Docker基础】Docker数据持久化与卷(Volume)介绍
运维·docker·容器·数据持久化·volume·
疯子的模样16 小时前
Docker 安装 Neo4j 保姆级教程
docker·容器·neo4j
虚伪的空想家17 小时前
rook-ceph配置dashboard代理无法访问
ceph·云原生·k8s·存储·rook