Karmada调度器 - 技术栈

调度器就像一个发动机，如果没有了发动机输入动力，是无法正常运行的。就像 Kubernetes 的调度器，它会负责根据节点的资源状态、Pod 的运行状态，判断 Pod 是调度到怎样的集群节点上去。对于 Karmada 这样的多云能力的调度器来说，调度能力也是大家非常关注的一个能力。

主要体现在，能不能通过调度的能力，将多集群的资源负载，控制在相对均衡的水位线，以及需要被调度的资源对象，以怎样的方式被调度到不同的集群上。同时，调度器的可扩展能力，也是非常重要的，正常情况下只要调度器是足够成熟的，一般的场景也都会满足了，但是也会有一些是无法满足的，就像 Kubernetes 场景下的支持 GPU 的能力，大多数 GPU 的尝试都会扩展 Kubernetes 的调度能力。

那接下来，我们就来看看 Karmada 的调度能力。

一、Karmada 调度能力

Karmada 的调度能力主要包含两个方面，一个是调度策略，一个是调度时机。调度策略是告诉使用者，调度器有哪些调度配置参数，可以提供使用和配置。调度时机是调度器自身根据调度策略，决定在什么样的情况下，以那种调度方式处理调度策略，使用者无需关心。

二、调度策略

1. Depulicated

**Depulicated：**调度到所有集群的副本数保持和创建的 Deployment 副本数一致，最终的副本总数就是 Deployment 的副本数 * 集群数。这种调度的方式，没有任何动态计算集群可用副本数的逻辑在里面，也就是不会涉及 karmada-estimator 的调用。

2. Divided

**Divided：**顾名思义就是拆分的意思，作用和 Duplicated 相反。对于 Divided 类型的，其中又分为 weighted (按权重) 和 Aggregated 策略。按权重分的又分为静态权重和动态权重。使用这种副本分配策略，会将创建 Deployment 的副本数作为总的副本数，根据策略的选择，拆分不同个数的副本到不同的集群上。

3. Aggregated

Aggregated：这是一种聚合调度策略，特性是调度的时候尽量紧凑一点。举例如果有 5 个集群，同时第一个集群已经有足够的资源，可以运行所有的副本数，那就会把所有的 Pod 都调度在第一个集群上。因此，如果第一个集群不够，就会放一部分到第二个集群，但是剩下的集群不会有副本调度过去。扩缩容的时候，特性也是一致的。这种调度策略会导致所有的集群的资源使用不均衡。

4. Static Weight

**Static Weight：**静态权重的分配副本的方式是需要在 PropagationPolicy 的 replicaScheduling 的部分设置相关策略，参见《云原生多云应用利器-- Karmada 总览篇》的 PropagationPolicy 的概念部分的 sample 的 yaml。

权重的意思就是，根据所有设置的权重求和，得到权重和，然后每一个权重/权重和，也就是副本的分配比例，副本总数 * 对应的权重比例的个数，就是对应权重应该需要被分配的副本数。注意这里会出现分配完之后，还有一点副本数没有被分配掉的情况，这个时候就是循环所有符合调度的集群，每一个集群一次分配一个副本的方式，直到所有剩下的副本数被分配完。

5. Dynamic Weight

**Dynamic Weight：**动态权重指的是，需要根据 karmada-estimator 计算的所有集群实时的可调度最大副本数，作为计算的参考。

举例，如有一个 Deployment 的副本数是 8，符合条件的集群有 2 个，第一个集群可调度的最大副本数是 20 个，第二个可调度的最大副本数是 6。那接下来动态权重的权重和就是 20+6=26。

第一个集群的权重就是 20，第二个集群的权重就是 6，第一个集群应该被分配的副本数就是 8 * (20/26)。第二个集群应该分配到的副本数就是 8 * (6/26)。

注意这里会出现分配完之后，还有一点副本数没有被分配掉的情况，这个时候就是循环所有符合调度的集群，每一个集群一次分配一个副本的方式，直到所有剩下的副本数被分配完。