火山引擎 DataLeap:从短视频 APP 实践看如何统一数据指标口径

更多技术交流、求职机会,欢迎关注字节跳动数据平台微信公众号,回复【1】进入官方交流群

短视频正在成为越来越多人发现世界的窗口,其背后的创作者生态建设是各大短视频 APP 不可忽视的重要组成部分。

为了激励更多优质内容生产,某短视频 APP 经常面向创作者主办投稿活动,而在复盘投稿数据过程中,该团队音乐运营人员在查找「音乐投稿率」指标时,同时搜索到了「音乐投稿率(音乐元素投稿比例)」,两个指标名称相似,但细究之下含义却大相径庭。

图:某短视频平台举办的创作者活动

不仅仅是「音乐投稿率」这一个指标,该短视频 APP 内部每天都会发生很多类似问题。

由于该短视频 APP 旗下业务线比较多,包括工具、社交等,每个活动协同的业务方多、人员复杂,而各业务指标都由自己单独定义,并独立交由不同研发人员开发,由此导致指标分散、口径不一致。

即使已经完成研发、运营、战略等各个团队对齐,也可能存在某团队因业务需求调整口径,又未周知其他团队,导致指标再次对不上,影响工作效率,甚至出现数据误差。

为了解决数据指标中存在的种种难题,数据团队基于火山引擎 DataLeap,把建设统一的数据指标管理平台纳入团队重点工作。据了解,火山引擎 DataLeap 能够解决"灵活数据分析"场景下的找数据、找口径的问题,帮助客户建设可共享、可视化、服务化的业务指标体系。

在机制层面,数据团队自上而下发起数据指标看板建设需求,从各业务指标诉求中抽象出统一的规范,并建立投稿数据使用规范。当收到一个新指标开发需求时,先明确指标负责人,其他方向同学则对齐该指标。举个例子,主端投稿"投稿数"业务指标建设,影像、图文投稿则要对齐该"投稿数"指标的口径。

在工具层面,数据团队通过 DataLeap 建立了统一的指标管理平台,辅助以上机制落地。首先,数据团队建立了一个跨业务团队的公共层数据,各业务方的数据均依赖公共层数据表进行加工。其次,基于火山引擎 DataLeap 的"指标平台"能力,将投稿核心指标分类管理,保障指标口径出口一致性。DataLeap 指标可视化能力,直接屏蔽了底层物理表,帮助运营等非研发人员,更清晰获取数据指标信息、操作指标变更、完成指标进一步分析。

通过以上方法,该短视频 APP 内部关于数据指标口径的答疑会和讨论会大大减少,一方面提高团队工作效率、指标使用效率,另一方面,也很大程度规避由指标口径不统一导致的下游数据问题。

随着越来越多公司数据规模的扩大,垂直业务单元会越来越多,而在跨垂直单元数据建设过程中,各种数据不统一、指标集中梳理难、指标统一定义难、指标追溯难等问题愈加突出。火山引擎 DataLeap 将提供从指标定义、运营、发现、洞察、质量到消费与反馈的全流程,提升指标使用效率、降低指标重复开发成本和数据答疑成本,为更多有数据指标建设的企业、行业提供服务。

点击跳转 火山引擎大数据研发治理套件DataLeap 了解更多

相关推荐
Bryce学亮18 小时前
股票数据成本分析工具
数据库
思麟呀18 小时前
MySQL表的约束
数据库·mysql
步十人18 小时前
【FastAPI】ORM-02.使用 ORM 高效处理数据库逻辑
服务器·数据库·fastapi
Apache IoTDB18 小时前
时序数据库 IoTDB + 时序智能服务平台 TimechoAI 亮相中国核电信息技术高峰论坛
数据库·时序数据库·iotdb
未若君雅裁18 小时前
Redis 和 MySQL 双写一致性:延迟双删、读写锁、MQ、Canal 怎么选?
数据库·redis·面试
会周易的程序员18 小时前
aiDgeScanner架构与实现
c++·ide·物联网·架构·node.js·aiot
罗超驿19 小时前
9.深度剖析MySQL约束的工程设计:自增主键的分布式局限、外键约束的权衡,与CHECK的版本适配实践
数据库·mysql
Kiyra19 小时前
Agent 的记忆不是存数据库就行:上下文预算与轻量记忆的设计实战
数据库·人工智能·后端·面试·职场和发展·哈希算法
jiayong2319 小时前
MySQL 8.0 数据库恢复问题完整解决方案
数据库·mysql
青主创享阁19 小时前
玄晶引擎XgenCore Works 2.9.2深度解析:自动化能力升级,重构私域与同城运营技术架构
重构·架构·自动化