[AWS]EKS启动HPA,HPA指标<unknown>,报错:error: Metrics API not available

背景:在AWS上创建的EKS集群,想要对于deployment部署HPA,来autoscling副本数。

1.HPA一般基于CPU或者内存对副本数进行控制,所以必须需要Metrics Server。

(Metrics Server 是 Kubernetes 集群的一个关键组件,它负责收集和提供节点和 Pod 的资源使用数据)

如何查看集群有无:Metrics Server

复制代码
kubectl get deployment metrics-server -n kube-system #检查 Metrics Server 状态:

如果没有Metrics Server,使用kubectl top会报错:

error: Metrics API not available

下载部署Metrics Server:

复制代码
kubectl apply -f https://github.com/kubernetes-sigs/metrics-server/releases/latest/download/components.yaml

2.部署HAP,yaml实例参考:

复制代码
apiVersion: autoscaling/v2
kind: HorizontalPodAutoscaler
metadata:
  name: "给hap取名字"
  namespace: "要部署到的命名空间"
spec:
  scaleTargetRef:
    apiVersion: apps/v1
    kind: Deployment
    name: "要控制的Deployment的名字"
  minReplicas: 2        #最小数
  maxReplicas: 8        #最大数
  metrics:
  - type: Resource
    resource:
      name: cpu
      target:
        type: Utilization
        averageUtilization: 70        #CPU 70%
  - type: Resource
    resource:
      name: memory
      target:
        type: Utilization
        averageUtilization: 80      #内存 80%

部署完成之后,使用命令:kubectl get hap -n 命名空间,就可以查看了。

报错:HPA指标<unknown>

这种情况是网上或者AI都会说得很复杂,七七八八的一大堆,其实原因很简单,就是你关联的deployment没有设置resource指标,只要在deployment.yaml中加上如下:

只需要requests字段就可以成功,不需要limit字段,重新部署之后可以看到<unknown>消失了。

不用尝试其他办法了,就是这个原因。

相关推荐
Code Slacker1 小时前
第八届传智杯AI云计算大数据开发挑战赛练习题库(三)
大数据·人工智能·云计算·竞赛
weisian1513 小时前
入门篇--知名企业-17-阿里巴巴-5--阿里云百炼平台:不止是效率工具,更是大模型落地的全链路神器
阿里云·云计算·百炼
2401_865854884 小时前
适配腾讯云实时音视频的10大作用场景
云计算·腾讯云·实时音视频
可观测性用观测云18 小时前
构建低利用率云资源面板,观测云助力企业缩减云成本
云计算
hk11241 天前
【RL/Virtualization】2026年度深度强化学习策略与云原生意识虚拟化基准索引 (Benchmark Index)
人工智能·云计算·数据集·元宇宙·强化学习
2401_865854881 天前
腾讯云实时音视频会运用到哪些场景?
云计算·腾讯云·实时音视频
じ☆冷颜〃2 天前
分布式系统中网络技术的演进与异构融合架构(HFNA)
笔记·python·物联网·设计模式·架构·云计算
always20223 天前
虚拟化入门(学习笔记)
云计算·虚拟化
Font Tian3 天前
【云计算2025年度总结】汇总和反思
容器·云计算·k8s·openstack·虚拟化
appearappear3 天前
阿里云同区域不同账户下两个服务器打通内网
服务器·阿里云·云计算