嗨,别着急做度量,平台工程需要先从“数据治理”开始做起

最近一直想写一篇关于"数据治理"和"度量相关" 的话题,一直太忙,今天静下心来写点自己的体会

先从平台工程说起

DevOps的兴起源于企业有意弥合运维与开发之间的裂隙,但在实施过程中有部分企业简单粗暴地将其理解为"让开发人员去负责运维的工作" ,甚至让高级开发人员接管了运维角色,导致了开发渐渐不堪重负。

这一现实引出了DevOps停滞背后的核心矛盾:开发者不想跟基础设施打交道,但企业在发展过程中又需要专人管控自己的基础设施。在此背景下,平台工程应运而生。

平台工程定义为"设计和构建工具链和工作流的学科,为云原生时代的软件工程组织提供自助服务功能。平台工程师提供的集成产品通常被称为'内部开发人员平台(IDP)',涵盖了应用程序整个生命周期的运营需求。"

平台和应用程序之间的界限在哪里?

"如果你可以把服务拿给另一个产品团队,甚至给另一个公司,他们可以马上使用,那么它就属于平台。"

本质依然是"新瓶装旧酒",是对"DevOps实践"提供"相对可参考性"的学科体系,除了技术以外,提供了如何建设,运营平台,以及建立企业内部开发者关系的新思路。

事实上,DevOps和平台工程并非这种"你死我活"的关系,在某种程度上,平台工程有可能为DevOps带来新生。

内部平台建设最终需要产出数据

"市面上任何一种工具,都不可能与平台一样能够满足企业的全部需求。企业必须花费充足的时间和精力,定制符合自身需求的平台。" 这是Gartner对于企业进行平台工程建设的建议

市面上其实已经涌现了很多类似的平台,比如阿里云效,腾讯Coding之类的,对于中小型团队,在没有资源投入基础设施建设的前提下,且对期望结果不是那么高的情况下,这些平台是合适的。

不过依然有"相当规模"(研发人员300人以上)的企业依然可能会选择建设内部的"研发效能平台"或者是"DevOps一体化平台",来解决个性化的问题。

企业建设平台最终的目的就是收集到数据,对研发过程数据进行分析,也就是很火的一个名词**"效能度量"。**

收集数据简单,治理规划数据不易

如下图所示,由于研发效能度量涉及各个阶段,来自不同的工具。

本文的目的不是谈如何进行定义效能度量(PS:这又是另外一个很大的话题),而是聊聊数据怎么收,如何正确合理的收集"有价值"的数据?

单纯从工具层面,排除指标定义和计算外,收集数据本身只是个技术问题。不管是对接api,还是对接数据库,BI工具很多。

可是单纯的工具数据,本身很少带"业务属性",这个其实对于企业最后的决策是没有多大价值的。

如果把工具数据,再叠加如下图左边这些因素,才可能让数据变的"有价值",变得有"说服力",不是吗?

可是,左边的问题,真的容易说清楚吗?很多建设内部平台的企业,左边的问题一开始就是说不清楚的, 如果能说清楚,就不会大费周折的搞这个事情了。似乎陷入了"鸡生蛋,还是蛋生鸡"的怪圈里,无法自拔。

不要过分度量,而来度量而度量

其实一开始,企业也在努力的建设设计流程,可是流程是需要经过"真实考验的",是不是业务流程是否真的能运转落地,或者切实得到认同?

"没关系,度量下看看?不是说,通过度量来改进吗?"

好像猛地一看,很合理,度量就是为了改进,管理大师都说了没有度量,就没有改进。

可是改进什么呢?哪里有问题呢?为什么要改进?

没关系,有了数据,自然就知道了

看似合理,其实隐藏一个致命的逻辑缺陷, 度量需要成本的,收入产出比如何?
**度量指标的设定,需要具有"牵引改进"的重大意义,如果一个指标不能做到"牵引"作用,那么就是个"假"指标。 **这里给出几点建议

  • 对于问题很明显的,不要一开始就去设计指标去度量它,需要立马去改进,而不是度量它
  • 不要一开始搞很多指标,看都看不完,有几个懂的?甚至多了,设计者本身都懵逼了
  • 不要上了就设计开发复杂系统去做度量,通过简单的查数据库,生成excel ,或者其他快捷手段(工具内置的能力),先捞一把数据看看再说,数据都是不对的,度量就是扯淡的
  • 不要一开始,就想的过于完美,最终你会发现会推倒重来

数据治理过程逐步建模

度量的前提一定是"数据治理"和"流程执行",前者是保证规范性,后者是保证有效性。

企业在一开始建设之初,一定是有些已经使用的系统,这些系统里都会有数据,需要从总体上考虑未来系统的目标和愿景。

  • 对于已有数据,需要进行甄别,什么是没有价值的数据,是否一定要保留?意义何在?卸下包袱,也许重新开始呢?
  • 不同的工具产生的数据差异很大,想清楚最终业务视角需要看"什么纬度"的数据,什么是"带头大哥",什么是"牵引点",谁是主谁是辅
  • 排除干扰,对于数据字段,学会做减法
  • 流程领域是死的,工具是活的,从领域中去抽象实体

数据治理的过程,伴随着规则的制定,流程的执行,没有谁先谁后之说,根据"已有数据"去分析用户行为和使用习惯,制定"被大部分人接受"的规则和流程,否定掉"少数人的个性化操作"。
最后,收集单纯的数据很简单,但是想得到"对业务有价值的数据",需要漫长的【收集-整理-调研-分析-设计定义-运行-优化-调整-反馈-再调整】过程。
没有人能一开始全部想清楚,按照"敏捷的思维",不要过度设计,自己瞎YY, 让用户用实际行动产生数据,引导用户行为,修正数据,这是作为"平台工程"的实践者需要去思考和琢磨的。

相关推荐
思码逸研发效能2 天前
如何通过对敏捷实践的调整,帮助远程团队提升研发效能?
研发效能·敏捷开发·devops·敏捷流程·研发效能度量
weixin_448350504 天前
十堰市数据治理:大数据治理在智慧城市中的应用探索
大数据·人工智能·自动化·智慧城市·数据治理·数据提取
梦想画家11 天前
dbt 数据分析工程实战教程(汇总篇)
数据治理·数据工程·分析工程
思码逸研发效能16 天前
度量数据是人工凭感觉录入的,产生的偏差如何解决?
研发效能·devops·研发效能度量·研发管理
vx1530278236221 天前
CDGA|在企业发展轨迹中,如何迅速拓宽数据应用的广度和深度
大数据·cdga·数据治理
weixin_4483505023 天前
探索自动化数据清洗技术的前沿趋势
大数据·运维·自动化·数据治理·数据提取
Shaidou_Data1 个月前
数据清洗的具体方法有哪些?
大数据·数据挖掘·数据分析·数据治理·数据清洗·1024程序员节
梦想画家1 个月前
理解dbt artifacts及其实际应用
数据治理·数据转换·1024程序员节·数据工程·分析工程
weixin_448350501 个月前
探索数据治理对网络安全的影响
网络·安全·web安全·数据挖掘·数据治理
Shaidou_Data1 个月前
安全无界:跨行业视角下的数据治理与网络安全实践
网络·安全·web安全·数据治理·数据质量·数据资源