K8S自动扩缩容实践

以下是 Kubernetes 中 Horizontal Pod Autoscaler (HPA)Vertical Pod Autoscaler (VPA) 的详细 YAML 配置过程及说明:


一、Horizontal Pod Autoscaler (HPA)

1. 前提条件:安装 Metrics Server

HPA 依赖资源指标(如 CPU/内存),需先安装 Metrics Server:

bash 复制代码
kubectl apply -f https://github.com/kubernetes-sigs/metrics-server/releases/latest/download/components.yaml

2. 示例 Deployment

部署一个需要自动扩缩容的应用:

yaml 复制代码
# deployment.yaml
apiVersion: apps/v1
kind: Deployment
metadata:
  name: nginx-deployment
spec:
  replicas: 2
  selector:
    matchLabels:
      app: nginx
  template:
    metadata:
      labels:
        app: nginx
    spec:
      containers:
      - name: nginx
        image: nginx:latest
        resources:
          requests:
            cpu: "100m"   # 必须定义资源请求,HPA 才能计算利用率
            memory: "128Mi"
          limits:
            cpu: "200m"
            memory: "256Mi"

3. 创建 HPA 规则

基于 CPU 利用率的自动扩缩容:

yaml 复制代码
# hpa-cpu.yaml
apiVersion: autoscaling/v2
kind: HorizontalPodAutoscaler
metadata:
  name: nginx-hpa
spec:
  scaleTargetRef:
    apiVersion: apps/v1
    kind: Deployment
    name: nginx-deployment
  minReplicas: 2
  maxReplicas: 10
  metrics:
  - type: Resource
    resource:
      name: cpu
      target:
        type: Utilization
        averageUtilization: 50  # 当 CPU 使用率超过 50% 时扩容

基于 内存利用率的自动扩缩容:

yaml 复制代码
# hpa-memory.yaml
apiVersion: autoscaling/v2
kind: HorizontalPodAutoscaler
metadata:
  name: nginx-hpa-memory
spec:
  scaleTargetRef:
    apiVersion: apps/v1
    kind: Deployment
    name: nginx-deployment
  minReplicas: 2
  maxReplicas: 10
  metrics:
  - type: Resource
    resource:
      name: memory
      target:
        type: Utilization
        averageUtilization: 70  # 当内存使用率超过 70% 时扩容

4. 验证 HPA

bash 复制代码
kubectl get hpa          # 查看 HPA 状态
kubectl describe hpa nginx-hpa  # 查看详细事件

二、Vertical Pod Autoscaler (VPA)

1. 前提条件:安装 VPA

VPA 需要独立组件,安装步骤如下:

bash 复制代码
# 克隆 VPA 仓库
git clone https://github.com/kubernetes/autoscaler.git
cd autoscaler/vertical-pod-autoscaler

# 安装 VPA 组件
./hack/vpa-up.sh

2. 创建 VPA 规则

yaml 复制代码
# vpa.yaml
apiVersion: autoscaling.k8s.io/v1
kind: VerticalPodAutoscaler
metadata:
  name: nginx-vpa
spec:
  targetRef:
    apiVersion: "apps/v1"
    kind: Deployment
    name: nginx-deployment
  updatePolicy:
    updateMode: "Auto"  # 模式:Auto/Off/Initial
  resourcePolicy:
    containerPolicies:
    - containerName: "*"  # 匹配所有容器
      minAllowed:
        cpu: "50m"
        memory: "64Mi"
      maxAllowed:
        cpu: "500m"
        memory: "1Gi"
参数说明:
  • updateMode
    • Auto:自动调整 Pod 资源请求并重启 Pod。
    • Initial:仅调整新 Pod 的资源请求。
    • Off:仅提供建议,不自动执行。
  • minAllowed/maxAllowed:资源调整的上下限。

3. 验证 VPA

bash 复制代码
kubectl describe vpa nginx-vpa  # 查看 VPA 建议
kubectl get pods -l app=nginx   # 观察 Pod 是否重启(Auto 模式下)

三、HPA + VPA 结合使用注意事项

  1. 优先级问题

    • HPA 和 VPA 同时作用于同一个 Deployment 时,可能因资源调整冲突导致不稳定。
    • 建议优先使用 HPA,VPA 仅在资源请求明显不合理时启用。
  2. VPA 的限制

    • VPA 的 Auto 模式会重启 Pod,可能影响服务可用性。
    • 不支持 StatefulSet 的所有场景(需谨慎使用)。
  3. 资源请求定义

    • 即使使用 VPA,部署时仍需定义初始 resources.requests,否则 Pod 可能无法调度。

四、完整流程示例

1. 部署应用

bash 复制代码
kubectl apply -f deployment.yaml

2. 部署 HPA

bash 复制代码
kubectl apply -f hpa-cpu.yaml

3. 部署 VPA

bash 复制代码
kubectl apply -f vpa.yaml

五、常见问题

1. HPA 不生效

  • 检查 Metrics Server

    bash 复制代码
    kubectl top pods  # 若无数据,说明 Metrics Server 未正常工作
  • 确认资源请求 :确保 Deployment 中定义了 resources.requests

2. VPA 未调整资源

  • 查看 VPA 建议

    bash 复制代码
    kubectl describe vpa <vpa-name>
  • 检查模式 :确认 updateMode 设置为 Auto


总结

  • HPA:通过调整 Pod 副本数应对流量波动,适合无状态服务。
  • VPA:通过调整 Pod 资源请求优化资源利用率,适合资源需求变化大的场景。
  • 两者结合时需谨慎,避免资源调整冲突。
相关推荐
炎码工坊3 小时前
微服务通信安全实战:JWT在分布式架构中的应用与最佳实践
安全·网络安全·云原生·系统安全·安全架构
藥瓿亭5 小时前
K8S认证|CKS题库+答案| 9. 网络策略 NetworkPolicy
linux·运维·docker·云原生·容器·kubernetes·cks
955.5 小时前
k8s从入门到放弃之Pod的容器探针检测
云原生·容器·kubernetes
yunken286 小时前
docker容器保存为不依赖基础镜像的独立镜像方法
java·docker·容器
langmeng1107 小时前
使用docker在3台服务器上搭建基于版本redis 6.x的一主两从模式
运维·redis·docker·容器·集群
leblancAndSherry8 小时前
Gitlab + Jenkins 实现 CICD
linux·运维·docker·kubernetes·gitlab·jenkins
脑瓜嗡11 小时前
Docker部署SpringBoot项目
spring boot·docker·容器
容器魔方12 小时前
KubeCon China 2025 | 与KubeEdge畅聊毕业经验与创新未来
云原生·容器·云计算
代码小学僧14 小时前
通俗易懂:给前端开发者的 Docker 入门指南
前端·docker·容器
运维潇哥14 小时前
k8s业务程序联调工具-KtConnect
云原生·容器·kubernetes