Kubernetes 云成本管理的现状,以及成本优化最佳实践

面对 2022 年的经济衰退,组织努力削减成本并提高云计算投资回报率。本报告展示了 Kubernetes 云成本管理的现状,并分享了经过验证的成本优化实践。

云支出浪费的主要驱动因素之一是一旦应用程序需求下降就无法缩减。

我们的数据显示,通过消除这种过度配置,组织每月的云支出将减少近50%

通过添加竞价实例,组织的云支出平均减少了 60%。

在我们分享最有效的成本削减方法之前,让我们先看一下当前的云成本管理格局。

云支出正在超过传统 IT 硬件


当被问及哪些项目将在 2022 年实现最高支出增长时,首席信息官们首先指出的是云计算。

2022 年第一季度,组织在云计算上的支出为183 亿美元 ,同比增长17.2%,其中公共云服务占总额的**125 亿美元(68%) 。**3

IDC 预测,云支出将比 2021 年增长22% ,达到902 亿美元,这是 2018 年以来的最高年度增长率。4

在对 753 名全球云决策者和用户进行的调查中,37% 的人表示他们的年度支出超过 1200 万美元。

尽管如此,团队仍难以控制不断增长的云成本

云的预算和规划非常棘手。

仅在 2022 年第一季度就浪费了价值 40 亿美元的资源

公司的云预算平均超出 13%。同时,最终平均浪费了 32% 的云总支出。6这意味着仅 2022 年第一季度就有价值 40 亿美元的云资源被浪费。

云浪费背后的主要原因是:
  • 缺乏对云使用情况和成本的可见性,
  • 过度配置,
  • 让云资源闲置,
  • 团队和部门之间的使用碎片化。
如果说有一个优化成本的时机的话,那就是现在:

81% 的 IT 领导者表示,他们的最高管理层指示他们减少或避免承担额外的云支出,作为当前经济低迷时期削减成本措施的一部分。8

我们分析了数千个使用 CAST AI 的云原生应用程序节省的云成本。我们的数据并非来自调查,因为我们评估了使用多种成本优化策略实现的平均节省。最强大的一项是纯粹的规模调整------实时消除云原生应用程序中未使用的 CPU。

我们通过要求我们的引擎将高成本的虚拟机替换为同等的低成本机器,同时保持按需实例和现货实例的相同比例来应用价格套利。最后,我们分析了将工作负载转移到 Spot 实例的影响,但将 Spot 实例的使用仅限于 Spot 友好型实例,例如无状态高副本容器。

与之前的行业调查相比,我们的数据表明,调整规模的影响更大:平均有 37% 的云原生应用程序的 CPU 从未被使用过。通过优化集群并删除不必要的计算资源,可以将服务器负载削减了 37%,从而释放这些资源以更有效地使用。

当我们添加定价套利时,规模调整的影响几乎占云计算费用的一半:规模调整和经济高效的虚拟机选择的总影响以美元计算达 46%。

通过将竞价实例添加到适用的工作负载中,以美元计算,平均节省了 60%。

Amazon Web Services、Google Cloud Platform 和 Microsoft Azure 的这些数字相似,不同提供商之间存在 +/-5% 的差异。此外,它们不依赖于应用程序的大小(我们注意到每月 1,000 美元的小型应用程序与每月 100,000 美元的大型应用程序之间的差异不到 5%)。这似乎表明规模调整问题是普遍存在的,并且与云原生应用程序的管理方式密切相关。

资源浪费造成严重的环境损失


过度供应和资源浪费对自然环境有直接影响。早在 2015 年,数据中心能耗减少 30% 就相当于在全球范围内节省 124.86 太瓦时。这足以为整个美国供电31.99年!9当转化为当前数据中心能源消耗水平时,您只能想象浪费的规模。

在云中运行虚拟机的环境成本还与数据中心所在区域的选择有关,因为某些区域依赖不太可持续的电力来源。

CAST AI 和类似的端到端平台可以帮助进一步减少对环境的影响,因为它们会选择耗电较少的 CPU 的新型机器,从而减少机器的能源足迹。

组织如何减少云浪费以节省数百万美元的费用


实时了解成本

的组织表示,云浪费背后的主要原因是缺乏对云使用和效率的可见性。10

解决上述问题几乎总是需要使用第三方解决方案,因为云提供商的成本可视性工具不会实时显示成本数据以进行异常检测,也不会提供足够的数据排序选项。

具有前瞻性的 FinOps、工程和 DevOps 团队使用第三方成本监控解决方案,提供对云成本的全面可见性。在内部构建自定义监控工具会浪费内部资源。

提高云资源利用率

如前所述,公司提供的云资源比最终使用的资源多 37%,导致资金和环境方面的大量浪费。11

通过比较配置的 CPU 与请求的 CPU 来跟踪过度配置。它们之间的差异越大,团队产生的浪费就越多。

对于集装箱应用来说,减少浪费的解决方案是可以实现的。在 CAST AI,我们看到公司每月通过消除过度配置而减少近 50% 的云支出,并在组合中添加现货实例,使云支出额外增加 10%。12

正如现实案例研究中所见,上述节省趋势在不同行业和公司规模中持续存在。

使用更多竞价实例

Spot 实例或虚拟机提供了巨大的成本削减机会,其折扣甚至比按需价格低 90%。

团队如何使用竞价实例?

使用竞价实例如何节省成本?

仅 Spot 节省的成本远高于我们之前 2022 年第一季度的 Kubernetes 状况分析中显示的水平。届时,"全现货"将影响成本 65%。

了解您的云基础设施的比较情况


如果您的团队使用 Kubernetes,您无需依靠平均值来了解云成本管理措施的进展情况。

最后的想法


云原生生态系统的快速扩张需要永久性的解决方案来帮助团队更有效地利用资源。

Kubernetes 是一项伟大的创新,但它本身并不会让应用程序更具成本效益。组织需要的是具有前瞻性的方法和解决方案,以停止浪费云资源并将节省的资金重新投资到其业务中。

用于准备本报告的数据:

参考

  • [1] -- This includes clusters running on on-demand resources, spot resources, and a mix of both.
  • [2] -- AlphaWise for Morgan Stanley, 1Q21 CIO Survey -- Data Suggests IT Acceleration.
  • [3, 4] -- International Data Corporation, Worldwide Quarterly Enterprise Infrastructure Tracker: Buyer and Cloud Deployment.
  • [5, 6, 7] -- Flexera 2022 State of the Cloud Report.
  • [8] -- Wanclouds, 2H 2022 Cloud Cost and Optimization Outlook.
  • [9] -- In 2015, data centers consumed 416.2 TWh of electricity globally (source: eceee, the European Council for an Energy Efficient Economy, www.eceee.org/all-news/ne...). The total energy consumption of the United States is 3.902 TWh (source: WorldData.info).
  • [10] -- Anodot, State of Cloud Cost Report 2022.
  • [11, 12] -- CAST AI data.
相关推荐
严格要求自己19 小时前
nacos-operator在k8s集群上部署nacos-server2.4.3版本踩坑实录
云原生·容器·kubernetes
少吃一口就会少吃一口19 小时前
k8s笔记
云原生·容器·kubernetes
葡萄皮Apple19 小时前
[CKS] K8S ServiceAccount Set Up
服务器·容器·kubernetes
2301_8061313621 小时前
Kubernetes 核心组件调度器(Scheduler)
云原生·容器·kubernetes
放手啊1 天前
sealos部署K8s,安装docker时master节点突然NotReady
docker·容器·kubernetes
颜淡慕潇2 天前
【K8S问题系列 | 9】如何监控集群CPU使用率并设置告警?
后端·云原生·容器·kubernetes·问题解决
运维&陈同学2 天前
【模块一】kubernetes容器编排进阶实战之k8s基础概念
运维·docker·云原生·容器·kubernetes·云计算
葡萄皮Apple2 天前
[CKS] K8S RuntimeClass SetUp
java·容器·kubernetes
斯普信专业组2 天前
Kubernetes网络揭秘:从DNS到核心概念,一站式综述
网络·容器·kubernetes
颜淡慕潇2 天前
【K8S系列 】在K8S集群怎么查看各个pod占用的资源大小与详细解决方案【已解决】
后端·云原生·容器·kubernetes·问题解决