火山引擎 DataLeap:从短视频 APP 实践看如何统一数据指标口径

更多技术交流、求职机会,欢迎关注字节跳动数据平台微信公众号,回复【1】进入官方交流群

短视频正在成为越来越多人发现世界的窗口,其背后的创作者生态建设是各大短视频 APP 不可忽视的重要组成部分。

为了激励更多优质内容生产,某短视频 APP 经常面向创作者主办投稿活动,而在复盘投稿数据过程中,该团队音乐运营人员在查找「音乐投稿率」指标时,同时搜索到了「音乐投稿率(音乐元素投稿比例)」,两个指标名称相似,但细究之下含义却大相径庭。

图:某短视频平台举办的创作者活动

不仅仅是「音乐投稿率」这一个指标,该短视频 APP 内部每天都会发生很多类似问题。

由于该短视频 APP 旗下业务线比较多,包括工具、社交等,每个活动协同的业务方多、人员复杂,而各业务指标都由自己单独定义,并独立交由不同研发人员开发,由此导致指标分散、口径不一致。

即使已经完成研发、运营、战略等各个团队对齐,也可能存在某团队因业务需求调整口径,又未周知其他团队,导致指标再次对不上,影响工作效率,甚至出现数据误差。

为了解决数据指标中存在的种种难题,数据团队基于火山引擎 DataLeap,把建设统一的数据指标管理平台纳入团队重点工作。据了解,火山引擎 DataLeap 能够解决"灵活数据分析"场景下的找数据、找口径的问题,帮助客户建设可共享、可视化、服务化的业务指标体系。

在机制层面,数据团队自上而下发起数据指标看板建设需求,从各业务指标诉求中抽象出统一的规范,并建立投稿数据使用规范。当收到一个新指标开发需求时,先明确指标负责人,其他方向同学则对齐该指标。举个例子,主端投稿"投稿数"业务指标建设,影像、图文投稿则要对齐该"投稿数"指标的口径。

在工具层面,数据团队通过 DataLeap 建立了统一的指标管理平台,辅助以上机制落地。首先,数据团队建立了一个跨业务团队的公共层数据,各业务方的数据均依赖公共层数据表进行加工。其次,基于火山引擎 DataLeap 的"指标平台"能力,将投稿核心指标分类管理,保障指标口径出口一致性。DataLeap 指标可视化能力,直接屏蔽了底层物理表,帮助运营等非研发人员,更清晰获取数据指标信息、操作指标变更、完成指标进一步分析。

通过以上方法,该短视频 APP 内部关于数据指标口径的答疑会和讨论会大大减少,一方面提高团队工作效率、指标使用效率,另一方面,也很大程度规避由指标口径不统一导致的下游数据问题。

随着越来越多公司数据规模的扩大,垂直业务单元会越来越多,而在跨垂直单元数据建设过程中,各种数据不统一、指标集中梳理难、指标统一定义难、指标追溯难等问题愈加突出。火山引擎 DataLeap 将提供从指标定义、运营、发现、洞察、质量到消费与反馈的全流程,提升指标使用效率、降低指标重复开发成本和数据答疑成本,为更多有数据指标建设的企业、行业提供服务。

点击跳转 火山引擎大数据研发治理套件DataLeap 了解更多

相关推荐
怀揣小梦想25 分钟前
微服务项目远程调用时的负载均衡是如何实现的?
微服务·架构·负载均衡
TDengine (老段)26 分钟前
TDengine 数据库建模最佳实践
大数据·数据库·物联网·时序数据库·tdengine·涛思数据
GateWorld32 分钟前
RISC-V:开源芯浪潮下的技术突围与职业新赛道 (二) RISC-V架构深度解剖(上)
架构·risc-v·指令集精简·寄存器设计·特权架构·模块化扩展
Elastic 中国社区官方博客37 分钟前
Elasticsearch 字符串包含子字符串:高级查询技巧
大数据·数据库·elasticsearch·搜索引擎·全文检索·lucene
Gauss松鼠会1 小时前
GaussDB应用场景全景解析:从金融核心到物联网的分布式数据库实践
数据库·分布式·物联网·金融·database·gaussdb
守城小轩1 小时前
Chromium 136 编译指南 - Android 篇:开发工具安装(三)
android·数据库·redis
尽兴-2 小时前
如何将多个.sql文件合并成一个:Windows和Linux/Mac详细指南
linux·数据库·windows·sql·macos
MARS_AI_2 小时前
大语言模型驱动智能语音应答:技术演进与架构革新
人工智能·语言模型·自然语言处理·架构·信息与通信
小小不董2 小时前
深入理解oracle ADG和RAC
linux·服务器·数据库·oracle·dba