八、K8S之HPA自动扩缩容

HPA

一、概念

HPA(Horizontal Pod Autoscaler,水平 Pod 自动伸缩)是 Kubernetes 中的一种特性,其作用是根据资源使用情况自动调整 Pod 的副本数,以实现应用程序的自动扩展和收缩。

HPA 可以根据 CPU 使用率或其他自定义指标来自动扩展或收缩 Pod。每隔30s(可以通过--horizontal-pod-autoscaler-sync-period修改)查询metrics的资源使用情况,Pod 的 CPU 使用率超过了 HPA 的目标值,那么 HPA 将创建更多的 Pod 来处理更多的工作负载。反之,如果 CPU 使用率降低,那么 HPA 将删除一些 Pod 以减少资源消耗。这使得集群可以根据负载需求动态扩展或收缩应用程序。

HPA 常用于处理负载波动的应用程序,例如 Web 服务器、API 服务等。通过设置合适的 HPA 目标值和最小/最大 Pod 数量,可以确保集群始终保持在正确的资源使用级别,从而避免资源浪费和服务中断。通常用于 Deployment,不适用于无法扩/缩容的对象,如 DaemonSet

在创建 HPA 时,您需要指定以下参数:

  • 目标资源:每个 Pod 根据 HPA 所监视的资源管理器对象进行计算。
  • 目标平均使用率:这是指将资源用量(如 CPU 或内存)与每个 Pod 的请求资源量相对比。HPA 根据此指标确定要在群集中启动的 Pod 的数量。
  • 最小 Pod 数量和最大 Pod 数量:根据当前的负载情况,HPA 将自动扩展或收缩 Pod 的数量,但是不能超出设置的最小和最大 Pod 数量。

通过 HPA 功能,Kubernetes 可以轻松地管理和调整应用程序的资源使用,提高了应用程序的可用性和容错性,在高负载时提供更好的响应能力,并减少了内存和 CPU 等资源的浪费。

二、使用

  • 创建
shell 复制代码
kubectl  autoscale deploy nginx-deploy --cpu-percent=20 --min=2 --max=5
  • 获取 HPA 信息
shell 复制代码
kubectl get hpa 

三、测试脚本

shell 复制代码
while true; do wget -q -O- http://192.168.31.100:30906 > /dev/null ; done
相关推荐
运维开发故事1 天前
基于 Arthas 的多集群在线诊断系统设计与实现
kubernetes
Patrick_Wilson3 天前
从「改个端口」到 502:Next.js on k8s 的容器端口、Service 映射与 env 覆盖
docker·kubernetes·next.js
阿里云云原生3 天前
AI 开发新常态:当 Cursor、Claude、Codex 并行,如何统一管理散落的 Skill 资产?
云原生·ai编程
探索云原生3 天前
K8s 1.36 这个 GA 特性,把 initContainer 拉模型的 hack 干掉了
ai·云原生·kubernetes
云恒要逆袭3 天前
运行你的第一个Docker容器
后端·docker·容器
Java之美3 天前
从edge-trigger到level-trigger,谈谈 Kubernetes controller 的开发范式
云原生
阿里云云原生4 天前
深度解构:当 Append-only 的 SLS 遇上 Update/Delete,是如何实现设计权衡的?
云原生
Java之美4 天前
一次k8s升级引发的DevicePlugin注册失败
云原生·kubernetes
秋播4 天前
nerdctl推送rancher本地镜像到harbor
云原生