数据仓库简介

一、数仓概念

数据仓库,英文名称为Data Warehouse,可简写为DW或DWH。数据仓库,是为企业所有级别的决策制定过程,提供所有类型数据支持的战略集合。它是单个数据存储,出于分析性报告和决策支持目的而创建。 为需要业务智能的企业,提供指导业务流程改进、监视时间、成本、质量以及控制。

二、数仓优势

为什么我们已经有数据库,还要建立数据仓库及其相关概念?是因为数据仓库能够更好解决我们遇到的实际问题,可以帮助我们多维度,多系统,多层次分析问题。下面是数据仓库的几个优势点。

1.决策更加科学合理

2.数字资源有效整合

3.数据质量准确一致

4.提高业务系统性能

我们对比一下传统的数据库和数据仓库。数据仓库是专门为数据分析设计的,涉及读取大量数据以了解数据之间的关系和趋势。数据库用于捕获和存储数据,例如记录事务的详细信息。

三、数仓层次

数仓一般分为ODS、DM、ADS层。其中ODS是数据运营层(明细层),来自各个原始系统,DW是数据仓库层,这里会把数据按照不同主题进行分类汇总,ADS是数据应用层,将数据按照不同主题汇总整理后,供报表等系统使用。

数据仓库一般使用Hive等数据仓库工具,这就和大数据开发很好的结合在一起,如果有兴趣可以关注一下大数据相关系列的文章。

大数据相关:https://blog.csdn.net/helongqiang/category_11192328.html

四、工作前景

数据仓库的使用范围很广,凡是涉及到数字化转型的企业都会涉及此项工作,比如互联网公司的数据部门,政府的数字政府建设,传统企业的数字化转型等 。数仓方面的工作大概有数据开发工程师、大数据开发工程师、数据仓库工程师、数据分析工程师等

五、其他事宜

1.文章来源

什么是数据仓库? - 知乎

2.侵权事宜

如有侵权请联系我删除。

3.支持博主

如果您觉得此文对您有帮助,请点赞、关注、收藏。祝您生活愉快!

相关推荐
Python私教1 小时前
model中能定义字段声明不存储到数据库吗
数据库·oracle
Francek Chen2 小时前
【大数据技术基础 | 实验十二】Hive实验:Hive分区
大数据·数据仓库·hive·hadoop·分布式
吾日三省吾码2 小时前
JVM 性能调优
java
弗拉唐3 小时前
springBoot,mp,ssm整合案例
java·spring boot·mybatis
oi774 小时前
使用itextpdf进行pdf模版填充中文文本时部分字不显示问题
java·服务器
mqiqe4 小时前
Python MySQL通过Binlog 获取变更记录 恢复数据
开发语言·python·mysql
工业甲酰苯胺4 小时前
MySQL 主从复制之多线程复制
android·mysql·adb
BestandW1shEs4 小时前
谈谈Mysql的常见基础问题
数据库·mysql
重生之Java开发工程师4 小时前
MySQL中的CAST类型转换函数
数据库·sql·mysql