26-数据仓库与Apache Hive

1.数据仓库 是什么?解决什么?

复制代码
 1.1 数据仓库
     Data Warehouse 数仓 / DW 
     是一个用于存储、分析、报告的数据系统.
     目的:构建面向分析的集成数据环境,分析结构为企业提供决策支持。
	
	数仓专注于分析
	 数仓本身不""生产""数据,其数据来源于不同的外部系统;
	 数仓本身不""消费""任何数据,其结果开放给各个外部应用使用;
	 
	 基于业务数据开展数据分析,基于分析结果为决策提供支撑!
     数据驱动决策的制定!!!!
     在哪里分析?数据库可以吗?
     可以,但是没必要
     
       https://baike.baidu.com/item/OLTP/5019563 

数仓出现了!

2.数据仓库的特点

复制代码
	2.1 面向主题
	   数据综合 归类 
	2.2 集成性
	  数据分布在不同的系统中,彼此独立、分散
	  进行数据综合和计算 
	  
	2.3 非易失性
  是数据分析的平台,而不是数据创造的平台 
  查询较多,修改删除很少
  
	2.4 时变性
	历史数据 2019 2021 
	数据仓库的数据要随着时间进行更新,以适应决策的需要。
	数据仓库的建设是一个项目,更是一个过程。

3. 理解SQL编程的概念、优点

相关推荐
嘉禾望岗5032 天前
hive架构及搭建
hive·hadoop·架构
孟意昶2 天前
Spark专题-第二部分:Spark SQL 入门(2)-算子介绍-Scan/Filter/Project
大数据·hive·分布式·sql·spark
Yuyang_Leo2 天前
Hive的优化:
数据仓库·hive·hadoop
boonya2 天前
Apache Hive 如何在大数据中发挥能量
hive·hadoop·apache
boonya2 天前
Apache Hive 能否脱离开Hadoop集群工作
hive·hadoop·apache
core51213 天前
Hive实战(三)
数据仓库·hive·hadoop
程序员小羊!13 天前
大数据电商流量分析项目实战:Hive 数据仓库(三)
大数据·数据仓库·hive
core51214 天前
Hive实战(一)
数据仓库·hive·hadoop·架构·实战·配置·场景
智海观潮14 天前
Spark SQL解析查询parquet格式Hive表获取分区字段和查询条件
hive·sql·spark
cxr82815 天前
基于Claude Code的 规范驱动开发(SDD)指南
人工智能·hive·驱动开发·敏捷流程·智能体