26-数据仓库与Apache Hive

1.数据仓库 是什么?解决什么?

复制代码
 1.1 数据仓库
     Data Warehouse 数仓 / DW 
     是一个用于存储、分析、报告的数据系统.
     目的:构建面向分析的集成数据环境,分析结构为企业提供决策支持。
	
	数仓专注于分析
	 数仓本身不""生产""数据,其数据来源于不同的外部系统;
	 数仓本身不""消费""任何数据,其结果开放给各个外部应用使用;
	 
	 基于业务数据开展数据分析,基于分析结果为决策提供支撑!
     数据驱动决策的制定!!!!
     在哪里分析?数据库可以吗?
     可以,但是没必要
     
       https://baike.baidu.com/item/OLTP/5019563 

数仓出现了!

2.数据仓库的特点

复制代码
	2.1 面向主题
	   数据综合 归类 
	2.2 集成性
	  数据分布在不同的系统中,彼此独立、分散
	  进行数据综合和计算 
	  
	2.3 非易失性
  是数据分析的平台,而不是数据创造的平台 
  查询较多,修改删除很少
  
	2.4 时变性
	历史数据 2019 2021 
	数据仓库的数据要随着时间进行更新,以适应决策的需要。
	数据仓库的建设是一个项目,更是一个过程。

3. 理解SQL编程的概念、优点

相关推荐
wyn200011284 小时前
Hive学习笔记
hive·笔记·学习
大数据狂人1 天前
从 Hive 数仓出发,全面剖析 StarRocks、MySQL、HBase 的使用场景与区别
hive·mysql·hbase
青木川崎1 天前
Hive_sql如何计算连续签到天数
hive·hadoop·sql
Jay Kay1 天前
hive新增列之后插入新数据时,新列为NULL的解决办法
数据仓库·hive·hadoop
Zhang.jialei2 天前
HiveMQ 2024.9 设计与开发文档
hive·物联网·activemq
Java烘焙师3 天前
架构师必备:实时对账与离线对账
hive·mysql·架构·对账
让头发掉下来3 天前
Sqoop详细学习文档
大数据·hive·hadoop·hbase·sqoop
非极限码农4 天前
Hive SQL (HQL) 编辑指南
hive·hadoop·sql
非极限码农4 天前
Hive数仓部署/分层/ETL脚本基础指南
数据仓库·hive·hadoop·etl