26-数据仓库与Apache Hive

1.数据仓库 是什么?解决什么?

复制代码
 1.1 数据仓库
     Data Warehouse 数仓 / DW 
     是一个用于存储、分析、报告的数据系统.
     目的:构建面向分析的集成数据环境,分析结构为企业提供决策支持。
	
	数仓专注于分析
	 数仓本身不""生产""数据,其数据来源于不同的外部系统;
	 数仓本身不""消费""任何数据,其结果开放给各个外部应用使用;
	 
	 基于业务数据开展数据分析,基于分析结果为决策提供支撑!
     数据驱动决策的制定!!!!
     在哪里分析?数据库可以吗?
     可以,但是没必要
     
       https://baike.baidu.com/item/OLTP/5019563 

数仓出现了!

2.数据仓库的特点

复制代码
	2.1 面向主题
	   数据综合 归类 
	2.2 集成性
	  数据分布在不同的系统中,彼此独立、分散
	  进行数据综合和计算 
	  
	2.3 非易失性
  是数据分析的平台,而不是数据创造的平台 
  查询较多,修改删除很少
  
	2.4 时变性
	历史数据 2019 2021 
	数据仓库的数据要随着时间进行更新,以适应决策的需要。
	数据仓库的建设是一个项目,更是一个过程。

3. 理解SQL编程的概念、优点

相关推荐
zgl_200537792 天前
ZGLanguage 解析SQL数据血缘 之 Python提取SQL表级血缘树信息
大数据·数据库·数据仓库·hive·hadoop·python·sql
Justice Young2 天前
Hive第四章:HIVE Operators and Functions
大数据·数据仓库·hive·hadoop
LF3_2 天前
hive,Relative path in absolute URI: ${system:user.name%7D 解决
数据仓库·hive·hadoop
德彪稳坐倒骑驴2 天前
Hive SQL常遗忘的命令
hive·hadoop·sql
Justice Young2 天前
Hive第六章:Hive Optimization and Miscellaneous
数据仓库·hive·hadoop
Justice Young3 天前
Hive第五章:Integeration with HBase
大数据·数据仓库·hive·hbase
Justice Young3 天前
Hive第三章:HQL的使用
大数据·数据仓库·hive·hadoop
yumgpkpm3 天前
AI评判:信创替代对Cloudera CDH CDP Hadoop大数据平台有何影响?
大数据·hive·oracle·flink·kafka·hbase·cloudera
yumgpkpm4 天前
Cloudera CDH5、CDH6、CDP7现状及替代方案
数据库·人工智能·hive·hadoop·elasticsearch·数据挖掘·kafka
心止水j4 天前
hive问题
数据仓库·hive·hadoop