5w2h构建数据仓库与sow

在数据仓库建设中,5w2h是一种结构化分析框架,用于全面规划和梳理数据仓库的核心目标、范围、逻辑和落地细节,确保建设方向清晰、需求明确

5W2H模型,不要理解得太复杂了,把它当作一个check list就好了。

比如在做需求的时候,问问需求方:

what,做什么;

why,为什么要做;

who,看什么体的数据or谁要看数据;

when什么时候要看,有没有DDL,是一天一次还是几个月看一次;

where想在什么地方看PC还是手机。

问完几个问题之后问问自己,

how,怎么实现,数仓实现还是写SQL取数?

how much,我投入多少的精力来应付这个需求?

除了对需求的时候,当你在做指标体系设计的时候,也可以如法炮制地问自己5W2H这几个问题。

what,这个指标体系是为了评价什么;

why,为什么要做这个指标体系;

who,这个指标体系是做给谁看的;

when,指标需要以什么样的时间粒度进行查看是合理的;

where,我需要的数据都在哪里;

how,数据怎么获得,从什么渠道获得;

how much,数据量有多少,怎么存储。

sow

statement of work 工作说明书 ,是指一份详细描述项目具体工作内容、范围、目标、交付物、时间表及双方责任的正式文件。

比譬在海航项目中我们就遇到一个问题,在验收标准上,报表的相应时间超过5s ,客户觉得太慢了,这块当时就没有写,后面的操作就比较麻烦。

科技这边的数据治理跟数仓的关系还是比较紧密的 ,主要是围绕数据质量

相关推荐
呆码科技3 小时前
数据驱动决策:商贸物流软件的数据分析与预测功能
大数据·人工智能
xcbrand3 小时前
专精特新品牌全案公司有哪些
大数据·人工智能·python
动恰客流管家4 小时前
动恰 3DV3丨门店选址与展会客流统计方案:精准数据赋能实体商业科学决策
大数据·人工智能
XM_jhxx4 小时前
厦门晚报报道简会入选省首批“小快轻准”数字化产品
大数据·人工智能
ZGi.ai4 小时前
一个LLM网关需要处理哪些工程问题?多模型路由与成本归因实战
大数据·网络·人工智能
xiaoyaohou114 小时前
024、大数据技术栈概览:Hadoop、Spark与Flink
大数据·hadoop·spark
搞科研的小刘选手4 小时前
【高届数人文社科会议】第十二届人文学科和社会科学研究国际学术会议(ICHSSR 2026)
大数据·人工智能·电子信息·电子工程·学术会议·信息工程·电路工程
亚远景aspice4 小时前
亚远景推出国内首款汽车研发合规AI全栈产品 填补和引领行业AI应用
大数据·人工智能
珠海西格电力5 小时前
红区光伏与零碳园区:管理系统如何破解分布式光伏并网困局
大数据·人工智能·分布式·物联网·能源
大大大大晴天️5 小时前
大数据分布式处理基石:分布式理论深度解析
大数据·分布式