26-数据仓库与Apache Hive

1.数据仓库 是什么?解决什么?

复制代码
 1.1 数据仓库
     Data Warehouse 数仓 / DW 
     是一个用于存储、分析、报告的数据系统.
     目的:构建面向分析的集成数据环境,分析结构为企业提供决策支持。
	
	数仓专注于分析
	 数仓本身不""生产""数据,其数据来源于不同的外部系统;
	 数仓本身不""消费""任何数据,其结果开放给各个外部应用使用;
	 
	 基于业务数据开展数据分析,基于分析结果为决策提供支撑!
     数据驱动决策的制定!!!!
     在哪里分析?数据库可以吗?
     可以,但是没必要
     
       https://baike.baidu.com/item/OLTP/5019563 

数仓出现了!

2.数据仓库的特点

复制代码
	2.1 面向主题
	   数据综合 归类 
	2.2 集成性
	  数据分布在不同的系统中,彼此独立、分散
	  进行数据综合和计算 
	  
	2.3 非易失性
  是数据分析的平台,而不是数据创造的平台 
  查询较多,修改删除很少
  
	2.4 时变性
	历史数据 2019 2021 
	数据仓库的数据要随着时间进行更新,以适应决策的需要。
	数据仓库的建设是一个项目,更是一个过程。

3. 理解SQL编程的概念、优点

相关推荐
步行cgn5 小时前
Servlet 注解:简化配置的完整指南
hive·hadoop·servlet
小白不想白a3 天前
【Hadoop】YARN、离线计算框架MapReduce、Hive
大数据·hive·hadoop·mapreduce·yarn
不辉放弃3 天前
为什么hive在处理数据时,有的累加是半累加数据
数据仓库·hive·hadoop
小四的快乐生活8 天前
Hive 存储管理测试用例设计指南
hive·hadoop·测试用例
PawSQL8 天前
十年磨一剑!Apache Hive 性能优化演进全史(2013 - )
大数据·hive·性能优化
越来越无动于衷9 天前
Spring Boot 整合 Spring MVC:自动配置与扩展实践
数据仓库·hive·hadoop
君不见,青丝成雪10 天前
Hadoop技术栈(四)HIVE常用函数汇总
大数据·数据库·数据仓库·hive·sql
yatingliu201911 天前
HiveQL | 个人学习笔记
hive·笔记·sql·学习
步行cgn13 天前
在 HTML 表单中,name 和 value 属性在 GET 和 POST 请求中的对应关系如下:
前端·hive·html
喂完待续13 天前
【Tech Arch】Hive技术解析:大数据仓库的SQL桥梁
大数据·数据仓库·hive·hadoop·sql·apache