5w2h构建数据仓库与sow

在数据仓库建设中,5w2h是一种结构化分析框架,用于全面规划和梳理数据仓库的核心目标、范围、逻辑和落地细节,确保建设方向清晰、需求明确

5W2H模型,不要理解得太复杂了,把它当作一个check list就好了。

比如在做需求的时候,问问需求方:

what,做什么;

why,为什么要做;

who,看什么体的数据or谁要看数据;

when什么时候要看,有没有DDL,是一天一次还是几个月看一次;

where想在什么地方看PC还是手机。

问完几个问题之后问问自己,

how,怎么实现,数仓实现还是写SQL取数?

how much,我投入多少的精力来应付这个需求?

除了对需求的时候,当你在做指标体系设计的时候,也可以如法炮制地问自己5W2H这几个问题。

what,这个指标体系是为了评价什么;

why,为什么要做这个指标体系;

who,这个指标体系是做给谁看的;

when,指标需要以什么样的时间粒度进行查看是合理的;

where,我需要的数据都在哪里;

how,数据怎么获得,从什么渠道获得;

how much,数据量有多少,怎么存储。

sow

statement of work 工作说明书 ,是指一份详细描述项目具体工作内容、范围、目标、交付物、时间表及双方责任的正式文件。

比譬在海航项目中我们就遇到一个问题,在验收标准上,报表的相应时间超过5s ,客户觉得太慢了,这块当时就没有写,后面的操作就比较麻烦。

科技这边的数据治理跟数仓的关系还是比较紧密的 ,主要是围绕数据质量

相关推荐
拾光师11 小时前
flume事务机制详解:保障数据可靠性的核心逻辑
大数据·flume
科技小郑13 小时前
吱吱企业通讯软件可私有化部署,构建安全可控的通讯办公平台
大数据·网络·安全·信息与通信·吱吱企业通讯
拓端研究室13 小时前
Python电影票房预测模型研究——贝叶斯岭回归Ridge、决策树、Adaboost、KNN分析猫眼豆瓣数据
大数据
喂完待续16 小时前
【Big Data】AI赋能的ClickHouse 2.0:从JIT编译到LLM查询优化,下一代OLAP引擎进化路径
大数据·数据库·clickhouse·数据分析·olap·big data·序列晋升
白日与明月18 小时前
Hive中的with子句
数据仓库·hive
蓝倾97618 小时前
淘宝/天猫店铺商品搜索API(taobao.item_search_shop)返回值详解
android·大数据·开发语言·python·开放api接口·淘宝开放平台
微三云、小叶19 小时前
“我店模式“当下观察:三方逻辑未变,三大升级重构竞争力
大数据·数据库
闯闯桑19 小时前
spark.sparkContext.broadcast() 与 org.apache.spark.sql.functions.broadcast 的区别
大数据·spark·apache
代码的余温21 小时前
Beats与Elasticsearch高效数据采集指南
大数据·elasticsearch·jenkins