八、K8S之HPA自动扩缩容

HPA

一、概念

HPA(Horizontal Pod Autoscaler,水平 Pod 自动伸缩)是 Kubernetes 中的一种特性,其作用是根据资源使用情况自动调整 Pod 的副本数,以实现应用程序的自动扩展和收缩。

HPA 可以根据 CPU 使用率或其他自定义指标来自动扩展或收缩 Pod。每隔30s(可以通过--horizontal-pod-autoscaler-sync-period修改)查询metrics的资源使用情况,Pod 的 CPU 使用率超过了 HPA 的目标值,那么 HPA 将创建更多的 Pod 来处理更多的工作负载。反之,如果 CPU 使用率降低,那么 HPA 将删除一些 Pod 以减少资源消耗。这使得集群可以根据负载需求动态扩展或收缩应用程序。

HPA 常用于处理负载波动的应用程序,例如 Web 服务器、API 服务等。通过设置合适的 HPA 目标值和最小/最大 Pod 数量,可以确保集群始终保持在正确的资源使用级别,从而避免资源浪费和服务中断。通常用于 Deployment,不适用于无法扩/缩容的对象,如 DaemonSet

在创建 HPA 时,您需要指定以下参数:

  • 目标资源:每个 Pod 根据 HPA 所监视的资源管理器对象进行计算。
  • 目标平均使用率:这是指将资源用量(如 CPU 或内存)与每个 Pod 的请求资源量相对比。HPA 根据此指标确定要在群集中启动的 Pod 的数量。
  • 最小 Pod 数量和最大 Pod 数量:根据当前的负载情况,HPA 将自动扩展或收缩 Pod 的数量,但是不能超出设置的最小和最大 Pod 数量。

通过 HPA 功能,Kubernetes 可以轻松地管理和调整应用程序的资源使用,提高了应用程序的可用性和容错性,在高负载时提供更好的响应能力,并减少了内存和 CPU 等资源的浪费。

二、使用

  • 创建
shell 复制代码
kubectl  autoscale deploy nginx-deploy --cpu-percent=20 --min=2 --max=5
  • 获取 HPA 信息
shell 复制代码
kubectl get hpa 

三、测试脚本

shell 复制代码
while true; do wget -q -O- http://192.168.31.100:30906 > /dev/null ; done
相关推荐
SPC的存折3 小时前
2、Docker命令与镜像、容器管理
linux·运维·服务器·docker·容器·eureka
Hachi被抢先注册了4 小时前
Docker学习记录
java·云原生·eureka
阿里云云原生4 小时前
安全养虾实践:当 AI 管家遇到线上预警,我的提效破局之路
云原生
香蕉鼠片5 小时前
Docker
运维·docker·容器
阿里云云原生6 小时前
相约 GenAICon 北京站:聊聊从环境工程出发,如何“简化”多源实时上下文?
云原生
Cat_Rocky7 小时前
docker简单学习
学习·docker·容器
数字化顾问8 小时前
(88页PPT)DG1092D1S4培训课件EASGERP总体架构基础(附下载方式)
微服务·云原生·架构
x10n98 小时前
基于提示词驱动的Function Call实现K8s Pod智能诊断
ai·云原生·容器·kubernetes
阿里云云原生8 小时前
当运维遇见本体论:Umodel 打造 IT 世界的统一认知地图
云原生
大罗LuoSir9 小时前
分布式微服务全貌了解-整体架构、特征和需关注解决的问题
java·缓存·微服务·zookeeper·容器·服务发现·负载均衡