数据治理-数据仓库和商务智能

业务驱动因素

数据仓库建设的主要驱动力是运营支持职能、合规需求和商务智能活动。

一个组织建设数据仓库的目标

  1. 支持商务智能活动
  2. 赋能商业分析和高效决策
  3. 基于数据洞察寻找创新方法。

一个组织应遵循如下指导原则

  1. 聚焦业务目标
  2. 以终为始
  3. 全局性的思考和设计,局部性的行动和建设
  4. 总结并持续优化
  5. 提升透明度和自助服务
  6. 与数据仓库一起建立元数据
  7. 协同
  8. 不要千篇一律

数据仓库建设

数据仓库建设指的是数据仓库中数据的抽取、清洗、转换、控制、加载等操作过程。传统上的数仓建设,主要关注结构化数据。商务智能和数仓空间现在也包含半结构化数据和非结构化数据。

数仓建设的方法

数仓建设的理论,都受到两位有影响力的思想领袖Bill Inmon和Ralph Kimball的影响,他们各有不同数据仓库建模和实施方法。Inmon把数据仓库定义为面向主题的、整合的、随时间变化、相对稳定的支持管理决策的集合。用规范化的关系模型来存储和管理数据。而Kimball则把数据仓库定义为"为查询和分析定制的交易数据的副本"。

两者遵循的核心理念相似:

  1. 数据仓库存储的数据来自其他系统
  2. 存储行为包括以提升数据价值的方式整合数据;
  3. 数据仓库便于数据被访问和分析使用;
  4. 组织建设数据仓库,因为他们需要让授权的利益相关方访问到可靠的、集成的数据;
  5. 数据仓库数据建设有很多目的,涵盖工作流支持、运营管理和预测分析。

数据仓库和业务系统的区别

  1. 面向主题的。数据仓库是基于主要业务实体组织的,而不关注功能或应用;
  2. 整合的。数据仓库中的数据是统一的、内聚的。保持相同的关键结构,结构的编码和解码、数据定义和命名规范在整个仓库中都是一致的。因为数据是整合的,数据仓库不是简单的运营数据的副本。

​​​​​​​数据仓库和数据集市的数据与应用程序中的数据不同

  1. 数据的组织形式是按主题域而不是按功能需要
  2. 数据是整合的数据,而不是孤立的烟囱数据
  3. 数据是随时间变化的系列数据,而非仅当前时间的值
  4. 数据在数据仓库中的延迟比在应用程序中高
  5. 数据仓库中提升的历史数据比应用程序中提供的历史数据多

​​​​​​​多维数据仓库

Kimball的多维数据仓库是数据仓库开发的另一个主要模式;多维模型通常成为星型模型,由事实表和维度表组成。

相关推荐
财迅通Ai2 分钟前
卫星化学一季度净利同比增34.97% 海外业务高增叠加价差走阔创盈利新高
大数据·人工智能·卫星化学
动恰客流管家4 分钟前
动恰3DV3丨展会客流统计解决方案:3D视觉技术赋能会展行业智慧化运营升级
大数据·数据结构·人工智能
juniperhan14 分钟前
Flink 系列第9篇:Flink 重启策略详解
java·大数据·数据仓库·flink
ModelWhale18 分钟前
从“社区”到“生态”:和鲸科技CEO范向伟在InnovateX大赛揭示OPC孵化“正确路径”
大数据·人工智能·科技
Cx330❀18 分钟前
线程进阶实战:资源划分与线程控制核心指南
java·大数据·linux·运维·服务器·开发语言·搜索引擎
xiaoduo AI20 分钟前
客服机器人知识库多久更新一次?智能 Agent 自动爬取新问答,过期话术能否及时淘汰?
大数据·人工智能·机器人
狂奔蜗牛飙车22 分钟前
精准分工:云南省中职大数据赛项(3 人团队)
大数据·中职组大数据应用与服务赛项·大数据应用与服务·竞赛指南·大数据入门指南
AI先驱体验官26 分钟前
BotCash:AI智能体变现从小 Demo 到商业产品的距离
大数据·人工智能·深度学习·重构·aigc
AcrelGHP35 分钟前
安科瑞AIM-T系列工业IT绝缘监测及故障定位解决方案为关键供电场所筑牢安全防线
大数据·运维·数据库
csgo打的菜又爱玩38 分钟前
2.Flink RPC通信流程解析
大数据·rpc·flink