26-数据仓库与Apache Hive

1.数据仓库 是什么?解决什么?

复制代码
 1.1 数据仓库
     Data Warehouse 数仓 / DW 
     是一个用于存储、分析、报告的数据系统.
     目的:构建面向分析的集成数据环境,分析结构为企业提供决策支持。
	
	数仓专注于分析
	 数仓本身不""生产""数据,其数据来源于不同的外部系统;
	 数仓本身不""消费""任何数据,其结果开放给各个外部应用使用;
	 
	 基于业务数据开展数据分析,基于分析结果为决策提供支撑!
     数据驱动决策的制定!!!!
     在哪里分析?数据库可以吗?
     可以,但是没必要
     
       https://baike.baidu.com/item/OLTP/5019563 

数仓出现了!

2.数据仓库的特点

复制代码
	2.1 面向主题
	   数据综合 归类 
	2.2 集成性
	  数据分布在不同的系统中,彼此独立、分散
	  进行数据综合和计算 
	  
	2.3 非易失性
  是数据分析的平台,而不是数据创造的平台 
  查询较多,修改删除很少
  
	2.4 时变性
	历史数据 2019 2021 
	数据仓库的数据要随着时间进行更新,以适应决策的需要。
	数据仓库的建设是一个项目,更是一个过程。

3. 理解SQL编程的概念、优点

相关推荐
howard200515 小时前
Hive实战任务 - 9.1 实现词频统计
hive·词频统计
满目山河•20 小时前
二、复制三台虚拟机
hive·hadoop·hbase
howard20051 天前
Hive实战任务 - 9.3 实现学生信息排序和统计
hive·排序·汇总·学生信息
番茄撒旦在上1 天前
什么样的表适合做拉链表
大数据·数据仓库·hive
howard20051 天前
Hive实战任务 - 9.5 实现网址去重
hive·网址去重
howard20051 天前
Hive实战任务 - 9.4 分科汇总求月考平均分
hive·分科汇总月考平均分
howard20051 天前
Hive实战任务 - 9.2 统计总分与平均分
hive·统计总分与平均分
yumgpkpm2 天前
Iceberg在Cloudera CDP集群详细操作步骤
大数据·人工智能·hive·zookeeper·spark·开源·cloudera
清平乐的技术专栏2 天前
Hive SQL中COALESCE 函数和NVL()函数、IFNULL函数区别
hive·hadoop·sql
爱吃大芒果2 天前
Flutter 列表优化:ListView 性能调优与复杂列表实现
开发语言·hive·hadoop·flutter·华为