在今年,平台工程正在迅速在 IT 企业中崭露头角,成为软件开发团队的必要实践。根据 CloudBees 发布的最新报告《2023年平台工程:快速采纳和影响》,83%的受访者已经完全实施了平台工程,或正处于某种实施阶段。
平台工程是一门设计和构建内部开发者平台(IDP)、工具链和工作流程的学科,它为软件工程团队提供了自助服务的能力。
IT 领导者一直在不断面临着要用更少的资源做更多事情的挑战。根据各种研究,开发者每周实际上只用了12.5%到30%的时间来编写代码。这也促使 IT 和 DevOps 领导者迫切寻找新的方法来提高开发者的生产力。由于平台工程建立了改进开发者生产力和开发者体验(DevEx)的最佳实践,因此已经成为备受关注的领域。
平台工程的实践已经成功地分担了开发者的大部分工作负担。调查数据显示,已经采用或计划采用平台工程的水平相当高(83%),其中:
- 20% 已经完全实施
- 33% 正在进行中
- 11% 最近刚刚开始
- 19% 处于规划阶段
仅有17%的受访者表示他们没有计划推出平台工程。
图片来源:CloudBees
平台工程的五个主要推动因素各约占回应的20%,并展示了平台工程对开发者和DevOps团队的重要和广泛好处。采用平台工程的推动因素包括:
- 开发者生产力(21%)
- 持续集成和持续交付(CI/CD)流水线的实施(20%)
- 工具和流程的标准化(20%)
- 安全性增强(20%)
- 基础设施即代码(19%)
业务影响
在过去的10年中,随着DevOps的崛起,平台工程的突出地位通常被归因于"我们忘记了开发者!"的现象。在DevOps崛起期间,许多事情向左移动,进一步加重了开发者的负担,并分散了注意力,使其远离了编码和创新。组织投资于平台工程,以满足多种需求。
与关注开发者生产力一致,平台工程的前五个用例中有三个:
- 开发、测试和生产环境的管理(22%)
- CI/CD 流水线管理(21%)
- 开发者平台即服务(PaaS)(18%)
目标和成功衡量标准
几乎所有最重要的平台工程目标都与 DevEx 和提高开发者生产力相关。排名最高的三个目标是:
- 开发者的自助服务(29%)
- 于采用(25%)
- 满足开发者需求(20%)
平台工程团队的成功衡量标准包括:
- 开发者生产力(23%)
- 内部KPI达标(19%)
- 成本控制(16%)
- 管理工具扩张(13%)
最后,调查显示,组织内的平台工程的归属位置各不相同,但最常见的归属位置包括:
- 云工程(30%)
- 基础设施团队(25%)
- 开发部门(20%)
- 共享服务(13%)
- 运维部门(13%)
根据调查数据显示,许多组织广泛采用平台工程,并将平台工程视为最大程度提高软件开发效率的关键元素。
平台工程与 AI
平台工程在接下来的12至18个月内将会面临什么挑战?
平台团队需要为持续的变化做好准备。公司被收购,新平台被收购(通常不会放弃旧平台),新应用程序和部署模式将继续出现。最近出现的颠覆性技术是生成式人工智能(AI),紧随其后的是人工智能(AI),特别是机器学习(ML)。AI 可以并将被应用于改进平台工程。
然而,像创建、运营和保护软件和系统的其他方面一样,AI/ML和生成式 AI 也带来了挑战。我们看到了三个关键方面:
首先是管理多个大型数据集和模型,这是 ML 算法和生成式 AI 大型语言模型(LLM)的生命线。类似于专门的专家系统,基于企业内部数据训练的特定领域的 LLM 在采用生成式 AI 时将变得尤为重要,前提是要维护数据的隐私和安全。
平台工程必须适应新的 AI 工作流程和数据、提示以及设计、训练和维护模型、向量数据库和大型数据集的 AI 工程师的流水线,这些数据集会不断增长和演变。这些 AI 流水线必须支持其工作流模式的特定要求,并与相互依赖的软件开发流水线和发布流程相一致和整合。
另外 AI/ML 和生成式 AI 通常具有与我们今天理解和运营的云和应用环境分开的操作特性。AI 引入了新的硬件操作环境,包括 AI 加速器、GPU、VPU和高度可扩展的 CPU,以及具有挑战性的性能和优化学习曲线。随着 AI,特别是生成式 AI 在企业中被采用和推广,平台工程将发挥关键作用。
关于 Walrus
Walrus 是基于平台工程理念 构建的全新一代应用管理平台,其一键部署和克隆复杂应用系统、集成 AI 大语言模型简化模板代码生成 以及灵活强大的应用和环境动态管理能力等特性备受用户青睐。借助 Walrus 用户可以将云原生的能力和最佳实践扩展到非容器化环境,并支持任意应用形态统一编排部署,降低使用基础设施的复杂度,为研发和运维团队提供易用、一致的应用管理体验,进而构建无缝协作的软件交付流程,加速企业业务创新。开源地址:github.com/seal-io/walrus
参考链接: